Ranh giới giữa trí thông minh con người và trí tuệ nhân tạo vừa trở nên hẹp hơn. Vào hôm thứ Năm, OpenAI đã tiết lộ o1, mô hình đầu tiên trong một loạt mô hình AI mới “được thiết kế để dành nhiều thời gian suy nghĩ hơn trước khi phản hồi,” công ty cho biết trong một bài đăng trên blog. Mô hình mới có thể xử lý các nhiệm vụ phức tạp và, so với các mô hình trước đây, giải quyết các vấn đề khó hơn trong khoa học, lập trình và toán học. Về bản chất, chúng suy nghĩ hơi giống con người hơn so với các chatbot AI hiện có.
Trong khi các phiên bản trước đây của mô hình OpenAI đã xuất sắc trong các bài kiểm tra tiêu chuẩn như SAT đến “Uniform Bar Examination” (kỳ thi Luật), công ty cho biết rằng o1 đã tiến thêm một bước. Nó hoạt động “tương tự như các sinh viên tiến sĩ trong các nhiệm vụ đánh giá đầy thách thức về vật lý, hóa học và sinh học.”
Ví dụ, nó đã đánh bại GPT-4o – một mô hình đa phương thức mà OpenAI công bố vào tháng 5 – trong kỳ thi tuyển chọn cho Olympiad Toán học Quốc tế với một khoảng cách lớn. GPT-4o chỉ giải đúng 13% các bài toán trong kỳ thi, trong khi o1 đạt 83%, công ty cho biết.
Sự tăng vọt trong khả năng lập luận của o1 một phần đến từ một kỹ thuật gợi ý được gọi là “chuỗi suy nghĩ”. OpenAI cho biết o1 “học cách nhận biết và sửa chữa lỗi của mình. Nó học cách chia nhỏ các bước khó thành những bước đơn giản hơn. Nó học cách thử một phương pháp khác khi phương pháp hiện tại không hiệu quả.”
Điều đó không có nghĩa là không có sự đánh đổi nào so với các mô hình trước đây. OpenAI lưu ý rằng mặc dù người kiểm tra thích phản hồi của o1 hơn trong các danh mục đòi hỏi nhiều lập luận như phân tích dữ liệu, lập trình và toán học, GPT-4o vẫn chiến thắng trong các nhiệm vụ ngôn ngữ tự nhiên như viết cá nhân.
Nhiệm vụ chính của OpenAI từ lâu đã là tạo ra trí tuệ nhân tạo tổng quát, hay AGI, một dạng AI vẫn còn giả thuyết mô phỏng khả năng của con người. Trong mùa hè, khi o1 vẫn đang trong quá trình phát triển, công ty đã công bố một hệ thống phân loại năm cấp mới để theo dõi tiến trình hướng tới mục tiêu đó. Các giám đốc điều hành của công ty được cho là đã nói với nhân viên rằng o1 đang tiến gần đến cấp độ hai, mà họ xác định là “những người lập luận” với khả năng giải quyết vấn đề ngang tầm con người.
Ethan Mollick, một giáo sư tại Trường Wharton thuộc Đại học Pennsylvania, người đã có quyền truy cập vào o1 trong hơn một tháng, cho biết những tiến bộ của mô hình có lẽ được minh họa rõ nhất qua cách nó giải “crossword puzzles”. Crossword puzzles thường khó đối với các mô hình ngôn ngữ lớn vì “chúng đòi hỏi giải quyết lặp đi lặp lại: thử và loại bỏ nhiều câu trả lời ảnh hưởng lẫn nhau,” Mollick viết trong một bài đăng trên Substack củaông. Hầu hết các mô hình ngôn ngữ lớn “chỉ có thể thêm một token/từ mỗi lần vào câu trả lời của chúng.” Nhưng khi Mollick yêu cầu o1 giải một crossword puzzle, nó đã suy nghĩ trong “108 giây đầy đủ” trước khi trả lời. Ông nói rằng suy nghĩ của nó vừa “sáng sủa” vừa “khá ấn tượng” ngay cả khi chúng không hoàn toàn chính xác.
Tuy nhiên, các chuyên gia AI khác ít bị thuyết phục hơn. Gary Marcus, giáo sư khoa học nhận thức tại Đại học New York, nói với Business Insider rằng mô hình này là “kỹ thuậtấn tượng” nhưng không phải là một bước nhảy vọt. “Tôi chắc chắn nó sẽ được quảng cáo rầm rộ, như thường lệ, nhưng nó chắc chắn không gần với AGI,” ông nói.
Kể từ khi OpenAI ra mắt GPT-4 vào năm ngoái, họ đã liên tục phát hành các phiên bản tiếp theo trong nỗ lực phát minh ra AGI. Vào tháng 4, GPT-4 Turbo đã được cung cấp cho các người đăng ký trả phí. Một bản cập nhật bao gồm khả năng tạo ra các phản hồi “mang tính hội thoại hơn.”
Công ty đã thông báo vào tháng 7 rằng họ đang thử nghiệm một sản phẩm tìm kiếm AI có tên là SearchGPT với một nhóm người dùng hạn chế.
Tác giả: Lakshmi Varanasi và Jyoti Mann
Link bài gốc: OpenAI takes another step closer to getting AI to think like humans with new ‘o1’ model | Bài được đăng vào ngày 13/09/2024, trên báo điện tử businessinsider.com
Dịch giả: Hoàng Phan – KenkAI Nhiều thứ hay
(*) Bạn có thể sao chép và chia sẻ thoải mái.
(**) Follow KenkAI Nhiều thứ hay để đọc các bài dịch khác và cập nhật thông tin bổ ích hằng ngày.
Để lại một bình luận