
- Các mô hình AI mạnh mẽ và giá rẻ của DeepSeek đã gây bão trong giới công nghệ.
- Altman cho biết OpenAI sẽ áp dụng một trong những phương pháp phổ biến của DeepSeek.
- Vị CEO này thừa nhận OpenAI đã “đi ngược dòng lịch sử” trong vấn đề trọng số mô hình.
Khi đối thủ áp dụng cách tiếp cận khác và thành công, đôi khi thay đổi hướng đi là điều đáng giá.
Đây là điều Sam Altman cho biết OpenAI sẽ thực hiện, theo một phiên hỏi đáp trên Reddit vào hôm thứ Sáu.
Cuộc thảo luận đề cập đến nhiều chủ đề về AI, nhưng đặc biệt Altman được hỏi về DeepSeek, công ty đã gây chấn động thế giới công nghệ sau khi tung ra các mô hình AI hiệu suất cao với chi phí sử dụng tương đối thấp.
Một người dùng Reddit hỏi liệu OpenAI có thể hiển thị “tất cả các token suy luận”. Điều này ám chỉ chuỗi suy nghĩ mà các mô hình AI “lập luận” mới sử dụng để chia nhỏ các tác vụ thành những bước nhỏ hơn – tương tự cách con người suy nghĩ khi đối mặt với những thách thức phức tạp.
Các mô hình o1 và o3 của OpenAI sử dụng phương pháp lập luận này, tuy nhiên chúng không hiển thị bất kỳ bước suy nghĩ trung gian nào cho người dùng, mà chỉ đưa ra câu trả lời cuối cùng.
Các mô hình lập luận của DeepSeek, như sản phẩm R1, hiển thị từng bước cho người dùng. Khi Business Insider thử nghiệm DeepSeek với cài đặt DeepThink của phòng thí nghiệm Trung Quốc này, nó đã chia sẻ khoảng 16 trang các bước tính toán trước khi đưa ra câu trả lời chính xác cho một câu hỏi khó.
Vào hôm thứ Sáu, Altman cho biết OpenAI sẽ theo đuổi cách tiếp cận của DeepSeek. “Đúng vậy, chúng tôi sẽ sớm cho ra mắt một phiên bản chi tiết và hữu ích hơn nhiều của điều này. Xin ghi nhận công của R1 đã giúp chúng tôi cập nhật,” ông viết.
Mã nguồn mở và trọng số mở
Yann LeCun, nhà khoa học trưởng về AI của Meta, cho rằng bài học quan trọng nhất từ thành công của DeepSeek là giá trị của các mô hình AI mã nguồn mở so với các mô hình độc quyền.
Các mô hình Llama của Meta phần lớn là mã nguồn mở, cho phép mọi người truy cập miễn phí các chi tiết quan trọng như trọng số và tham số. Việc chia sẻ cơ chế hoạt động bên trong của các mô hình như thế này giúp các nhà phát triển và nhiều công ty khác có thể tùy chỉnh chúng cho mục đích sử dụng riêng.
Mặc dù có tên là OpenAI, công ty này đã theo đuổi một cách tiếp cận khá khép kín trong việc phát triển AI cho đến nay. Hầu hết các mô hình của họ đều là độc quyền và công ty khởi nghiệp này thu phí để truy cập.
Trong buổi hỏi đáp trên Reddit vào thứ Sáu, Altman được hỏi liệu OpenAI có cân nhắc việc công bố một số trọng số mô hình và xuất bản một số nghiên cứu hay không.
Vâng, chúng tôi đang thảo luận về vấn đề này. Cá nhân tôi cho rằng chúng tôi đã đi sai hướng và cần phải tìm ra một chiến lược nguồn mở khác; không phải ai tại OpenAI cũng chia sẻ quan điểm này, và hiện tại đây cũng không phải là ưu tiên cao nhất của chúng tôi,” Altman trả lời.
Nguồn: BI, 01/02/2025
Bài gốc: ‘Sam Altman says OpenAI will embrace two new AI approaches, one from DeepSeek and another from Meta‘
© Dịch: Dieter R – KenkAI

Để lại một bình luận