DeepMind tuyên bố công cụ AI mới nhất của họ là một thiên tài về các bài toán khoa học và toán học

“`html

Phòng thí nghiệm R&D AI của Google, DeepMind cho biết họ đã phát triển một hệ thống AI mới để giải quyết các vấn đề bằng các giải pháp “có thể chấm điểm bằng máy”.

DeepMind cho biết, trong các thử nghiệm, hệ thống có tên AlphaEvolve có thể giúp tối ưu hóa một số cơ sở hạ tầng mà Google sử dụng để đào tạo các mô hình AI của mình. Công ty cho biết họ đang xây dựng giao diện người dùng để tương tác với AlphaEvolve và có kế hoạch khởi động chương trình truy cập sớm cho các học giả được chọn trước khi có thể triển khai rộng rãi hơn.

Hầu hết các mô hình AI đều ảo giác. Do kiến trúc xác suất của chúng, đôi khi chúng tự tin bịa ra mọi thứ. Trên thực tế, các mô hình AI mới hơn như o3 của OpenAI tạo ra ảo giác nhiều hơn so với những người tiền nhiệm của chúng, minh họa tính chất đầy thách thức của vấn đề.

AlphaEvolve giới thiệu một cơ chế thông minh để cắt giảm ảo giác: một hệ thống đánh giá tự động. Hệ thống sử dụng các mô hình để tạo, phê bình và đưa ra một nhóm các câu trả lời có thể cho một câu hỏi, đồng thời tự động đánh giá và chấm điểm các câu trả lời về độ chính xác.

Hệ thống AlphaEvolve của DeepMind được thiết kế để các chuyên gia trong lĩnh vực sử dụng. Tín dụng hình ảnh: DeepMind

AlphaEvolve không phải là hệ thống đầu tiên thực hiện cách tiếp cận này. Các nhà nghiên cứu, bao gồm một nhóm tại DeepMind vài năm trước, đã áp dụng các kỹ thuật tương tự trong các lĩnh vực toán học khác nhau. Nhưng DeepMind tuyên bố việc AlphaEvolve sử dụng các mô hình “hiện đại nhất” — đặc biệt là các mô hình Gemini — khiến nó có khả năng hơn đáng kể so với các trường hợp AI trước đó.

Để sử dụng AlphaEvolve, người dùng phải nhắc hệ thống bằng một vấn đề, tùy chọn bao gồm các chi tiết như hướng dẫn, phương trình, đoạn mã và tài liệu liên quan. Họ cũng phải cung cấp một cơ chế để tự động đánh giá các câu trả lời của hệ thống dưới dạng một công thức.

Vì AlphaEvolve chỉ có thể giải quyết các vấn đề mà nó có thể tự đánh giá, hệ thống chỉ có thể hoạt động với một số loại vấn đề nhất định — đặc biệt là những vấn đề trong các lĩnh vực như khoa học máy tính và tối ưu hóa hệ thống. Trong một hạn chế lớn khác, AlphaEvolve chỉ có thể mô tả các giải pháp dưới dạng thuật toán, khiến nó không phù hợp với các vấn đề không phải là số.

SỰ KIỆN TECHCRUNCH

THAM GIA CÙNG CHÚNG TÔI TẠI TECHCRUNCH SESSIONS: AI

ĐẢM BẢO VỊ TRÍ CỦA BẠN CHO SỰ KIỆN HÀNG ĐẦU TRONG NGÀNH AI CỦA CHÚNG TÔI VỚI CÁC DIỄN GIẢ TỪ OPENAI, ANTHROPIC VÀ COHERE. TRONG MỘT THỜI GIAN GIỚI HẠN, VÉ CHỈ CÓ GIÁ 292 ĐÔ LA CHO MỘT NGÀY ĐẦY ĐỦ CÁC CUỘC NÓI CHUYỆN, HỘI THẢO CỦA CHUYÊN GIA VÀ KẾT NỐI MẠNG LƯỚI TIỀM NĂNG.

TRIỂN LÃM TẠI TECHCRUNCH SESSIONS: AI

ĐẢM BẢO VỊ TRÍ CỦA BẠN TẠI TC SESSIONS: AI VÀ CHO HƠN 1.200 NGƯỜI RA QUYẾT ĐỊNH NHỮNG GÌ BẠN ĐÃ XÂY DỰNG — MÀ KHÔNG TỐN NHIỀU CHI PHÍ. CÓ SẴN ĐẾN NGÀY 9 THÁNG 5 HOẶC KHI BÀN HẾT.

Berkeley, CA