Công nghệ

Alibaba ra mắt các mô hình AI chuyên biệt về toán học được cho là vượt trội hơn các LLM của OpenAI, Google.

Published

8 tháng ago

25 Tháng 8, 2024

Dieter R.

Các mô hình ngôn ngữ lớn Qwen2-Math mới được kỳ vọng sẽ giúp giải quyết các bài toán toán học phức tạp.”

*Các mô hình LLM dành riêng cho toán học của Alibaba đã nâng cao vị thế của công ty trong lĩnh vực AI*

Để dẫn đầu trong cuộc đua phát triển trí tuệ nhân tạo (AI), Alibaba (Alibaba Group Holding) đã cho ra mắt Qwen2-Math. Đây là một bộ các mô hình ngôn ngữ lớn được thiết kế đặc biệt để giải quyết các bài toán toán học. Alibaba tự tin cho biết Qwen2-Math có khả năng vượt qua cả GPT-4o của OpenAI, một trong những mô hình AI hàng đầu hiện nay.

Trong một bài đăng trên GitHub, nhóm Qwen thuộc đơn vị điện toán đám mây của Alibaba đã chia sẻ về quá trình nghiên cứu kéo dài một năm để cải thiện khả năng lập luận toán học của các mô hình ngôn ngữ lớn. Nhóm nghiên cứu đã tập trung vào việc nâng cao khả năng giải quyết các bài toán số học của các mô hình này.

THÀNH TÍCH VƯỢT TRỘI CỦA QWEN2 TRONG LĨNH VỰC TOÁN HỌC

Nhóm Qwen chia sẻ trong bài đăng rằng: “Trong năm qua, chúng tôi đã dành nhiều nỗ lực để nghiên cứu và nâng cao khả năng lập luận của các mô hình ngôn ngữ lớn (LLM), đặc biệt tập trung vào khả năng giải quyết các bài toán số học”.

Alibaba đã phát hành Qwen2 vào tháng 6, một hệ thống gồm nhiều mô hình AI khác nhau. Những mô hình này được thiết kế để tạo ra các văn bản giống như con người. Mỗi mô hình trong Qwen2 có một số lượng tham số khác nhau.

Tham số ở đây giống như những nút điều chỉnh nhỏ, giúp chúng ta tùy chỉnh cách mô hình hoạt động để đạt được kết quả mong muốn. Nhờ vào các tham số này, các mô hình AI có thể thực hiện nhiều tác vụ phức tạp, từ viết văn, dịch thuật cho đến trả lời các câu hỏi phức tạp.

Theo nhóm Qwen, mô hình Qwen2-Math-72B-Instruct, với số lượng tham số lớn nhất, đã xuất sắc vượt qua các đối thủ cạnh tranh đến từ các công ty công nghệ hàng đầu Hoa Kỳ như OpenAI (GPT-4o), Anthropic (Claude 3.5 Sonnet), Google (Gemini 1.5 Pro) và Meta (Llama-3.1-405B) trong các bài kiểm tra toán học.

Mặc dù nhóm Qwen bày tỏ hy vọng rằng Qwen2-Math sẽ trở thành công cụ hữu ích để giải quyết các bài toán phức tạp, họ cũng thừa nhận rằng mô hình hiện tại chỉ hỗ trợ tiếng Anh. Tuy nhiên, nhóm đang tích cực phát triển các phiên bản song ngữ và đa ngôn ngữ để mở rộng phạm vi ứng dụng của mô hình trong tương lai.

*Tongyi Qianwen, còn được gọi là Qwen, hiện bao gồm các LLM dành riêng cho toán học.*

Thành tích dẫn đầu bảng xếp hạng 10 mô hình nguồn mở hàng đầu thế giới của Qwen-72B-Instruct LLM đã càng khẳng định vị thế hàng đầu của Alibaba trong lĩnh vực trí tuệ nhân tạo. Những mô hình toán học tiên tiến này không chỉ góp phần nâng cao uy tín của công ty mà còn chứng tỏ sự phát triển vượt bậc của AI tại Trung Quốc.

TIỀM NĂNG CỦA CÁC MÔ HÌNH NGÔN NGỮ LỚN TRUNG QUỐC

Với việc mở cửa mã nguồn Tongyi Qianwen trong hơn một năm, Alibaba đã tạo ra một cộng đồng phát triển sôi động. Các nhà phát triển trên toàn thế giới có thể tự do truy cập, sửa đổi và chia sẻ mã nguồn, từ đó tạo ra những ứng dụng và dịch vụ mới dựa trên nền tảng này. Điều này không chỉ thúc đẩy sự phát triển của AI mà còn góp phần xây dựng một hệ sinh thái công nghệ mở.

Sự công nhận cao quý dành cho gia đình các mô hình ngôn ngữ lớn của Tập đoàn Alibaba cho thấy sự tiến bộ nhanh chóng của công ty trong lĩnh vực trí tuệ nhân tạo. Ảnh: Shutterstock

Trong bảng xếp hạng LLM của SuperClue vào tháng 7, Qwen2-72B-Instruct đã thể hiện khả năng vượt trội, chỉ xếp sau hai mô hình hàng đầu là GPT-4o và Claude 3.5 Sonnet. Điều này chứng tỏ mô hình này có khả năng tính toán, suy luận logic, mã hóa và hiểu văn bản rất tốt.

Theo đánh giá của SuperClue, khoảng cách giữa các mô hình AI của Trung Quốc và Mỹ đang dần thu hẹp lại. Kết quả này cho thấy nỗ lực không ngừng của các nhà nghiên cứu Trung Quốc trong việc phát triển các LLM có khả năng cạnh tranh trên trường quốc tế.

Năm mô hình của Trung Quốc, bao gồm Alibaba, công ty khởi nghiệp Deepseek, SenseTime niêm yết tại Hồng Kông, nhà cung cấp điện thoại thông minh Oppo và nỗ lực hợp tác giữa Đại học Thanh Hoa và công ty khởi nghiệp Zhipu AI, đã vượt trội hơn GPT-4 Turbo – một trong những mô hình tốt nhất từ OpenAI do Microsoft hậu thuẫn, theo SuperClue.

Một bài kiểm tra riêng được công bố vào tháng 7 bởi LMSYS – một tổ chức nghiên cứu mô hình AI được hỗ trợ bởi Đại học California, Berkeley – cho thấy Qwen2-72B được xếp hạng 20, trong khi các mô hình độc quyền từ OpenAI, Anthropic và Google chiếm hầu hết các vị trí trong top 10.

tác giá: Ann Cao in Shanghai, bài đăng vào ngày 10 Aug 2024 scmp.com

tên bài viết: “Alibaba launches maths-specific AI models said to outperform LLMs from OpenAI, Google“

Tác giả: Ann Cao xuất bản ngày 10 tháng 8 năm 2024.

Link bài gốc: “Alibaba launches maths-specific AI models said to outperform LLMs from OpenAI, Google”

Dịch giả: Hoàng Phan – KenkAI Nhiều thứ hay

(*) Bạn có thể sao chép và chia sẻ thoải mái.

(**) Follow KenkAI Nhiều thứ hay để đọc các bài dịch khác và cập nhật thông tin bổ ích hằng ngày.

Công nghệ

Khóa học AI tạo sinh 5 ngày: Livestream Ngày 1

Published

3 tuần ago

1 Tháng 4, 2025

Dieter R.

Chào bạn đến với khóa học AI tạo sinh 5 ngày độc đáo. Khóa học được tổ chức bởi Google trên nền tảng Kaggle. Đây là một cơ hội hiếm có để học hỏi trực tiếp từ các chuyên gia hàng đầu của Google. Đặc biệt là từ đội ngũ Google DeepMind.

Nội dung chính

Khóa Học AI Tạo Sinh 5 Ngày: Livestream Ngày 1

Paige Bailey sẽ thảo luận về các bài tập với các tác giả khóa học. Bên cạnh đó có những khách mời đặc biệt khác từ Google. Khách mời hôm nay bao gồm Warren Barkley, Logan Kilpatrick, Kieran Milan, Anant Nawalgaria, Irina Sigler và Mat Velloso.

Video có phụ đề tiếng Việt.

Video gốc (không có phụ đề tiếng Việt): https://www.youtube.com/live/WpIfAeCIFc0

Thông tin thêm

Đào Tạo Toàn Diện cho Hơn 140.000 Nhà Phát Triển

Khóa học Generative AI 5 ngày của Google không chỉ là một chuỗi bài giảng đơn thuần. Nó còn là một hành trình học tập toàn diện. Khóa học được thiết kế cẩn thận. Nhằm cung cấp kiến thức chuyên sâu về AI tạo sinh. Với số lượng hơn 140.000 nhà phát triển đã đăng ký tham gia. Đây là một trong những sự kiện quan trọng nhất từng được tổ chức cho các nhà phát triển.

Khóa học đã được thiết kế tinh tế. Kết hợp giữa lý thuyết, thực hành và tương tác cộng đồng. Nhằm giúp những người tham gia có được hiểu biết vững chắc về Gen AI. Từ cơ bản đến nâng cao.

Mỗi ngày trong khóa học đều tập trung vào một chủ đề cụ thể. Nhằm mang đến cho người học góc nhìn toàn diện về công nghệ AI tạo sinh.

Ngày 1 khám phá về Các Mô hình Nền tảng và Kỹ thuật Prompt;
Ngày 2 đi sâu vào Embeddings và Vector Stores/Databases;
Ngày 3 tập trung vào Generative AI Agents;
Ngày 4 nghiên cứu về Domain-Specific LLMs;
và cuối cùng, Ngày 5 giới thiệu về MLOps cho AI tạo sinh.

Cách tiếp cận đa dạng này giúp người học có thể nắm bắt được cả lý thuyết nền tảng. Lẫn các ứng dụng thực tế của AI tạo sinh.

Trải Nghiệm Học Tập Toàn Diện Với Podcast AI, Phòng Thí Nghiệm Mã Và Tương Tác Trực Tiếp Cùng Chuyên Gia

Điểm đặc biệt của khóa học là các bài tập được thiết kế đa dạng, bao gồm podcast được tạo bởi AI (sử dụng NotebookLM), các bài báo trắng (white papers) thông tin do các chuyên gia Google viết, và các phòng thí nghiệm mã (code labs) để người học có thể trải nghiệm thực tế với Gemini API và các công cụ khác. Người học cũng có cơ hội tham gia vào các buổi phát trực tiếp với các khách mời chuyên gia từ Google, nơi họ có thể đặt câu hỏi và tương tác với những người tạo ra khóa học. Đây là cơ hội quý báu để đi sâu hơn vào các chủ đề chuyên đề và hiểu rõ hơn về ứng dụng của AI tạo sinh.

Ngoài ra, khóa học còn cung cấp một kênh Discord được hỗ trợ tích cực bởi các nhân viên Google, tạo ra một không gian cộng đồng sôi động để trao đổi kiến thức và chia sẻ trải nghiệm. Các phòng thí nghiệm mã trên Kaggle cho phép người tham gia thử nghiệm với các kỹ thuật và công cụ AI tạo sinh khác nhau, bao gồm Gemini API, Embeddings, công cụ mã nguồn mở như Langraph cũng như Vertex AI. Đối với những ai đã bỏ lỡ khóa học trực tiếp, một số nội dung phổ biến nhất đã được điều chỉnh thành định dạng tự học và có sẵn dưới dạng Kaggle Learn Guide, giúp mọi người vẫn có thể tiếp cận với kiến thức quý giá này

Danh sách tham khảo

[1] 5-Day Gen AI Intensive Course with Google Learn Guide – Kaggle
[2] Google and Kaggle launch five-day intensive Generative AI course
[3] Kaggle’s 5-Day Gen AI Intensive Course

Công nghệ

AI Cách Mạng: Khởi Nghiệp Công Nghệ Tương Lai Ngay

Ông Lee cho biết: “Nếu thuộc thế hệ trước, chúng tôi dễ dàng có tới 200 nhân viên. Chúng tôi có cơ hội để suy nghĩ lại về điều đó, về cơ bản là viết lại kịch bản”.

Published

2 tháng ago

23 Tháng 2, 2025

Dieter R.

Khởi nghiệp AI đang định hình tương lai kinh doanh. Với sức mạnh công nghệ, startup AI giải phóng tiềm năng sáng tạo, tối ưu hóa quy trình và mở ra những cơ hội kinh doanh chưa từng có trong kỷ nguyên số.

DeepSeek đang tạo ra một bước ngoặt mới cho Thung lũng Silicon.

Hầu như ngày nào, doanh nhân Grant Lee cũng được các nhà đầu tư thuyết phục xuống tiền. Một số người thậm chí còn gửi cho ông và những người đồng sáng lập khác nhiều giỏ quà đắt đỏ để lấy lòng.

Ông Lee, 41 tuổi, trước đây đã giúp thành lập một công ty khởi nghiệp AI có tên Gamma. Giống như nhiều startup trẻ khác ở Thung lũng Silicon, Gamma theo đuổi một chiến lược mới: sử dụng các công cụ trí tuệ nhân tạo để tăng năng suất của nhân viên, từ dịch vụ khách hàng, tiếp thị đến mã hóa và nghiên cứu.

Điều đó có nghĩa là Gamma không cần thêm tiền mặt nữa, ông Lee cho biết. Công ty của ông chỉ tuyển dụng 28 người cũng có thể tạo ra hàng chục triệu USD doanh thu định kỳ hàng năm với gần 50 triệu người dùng. Gamma cũng có lãi.

Mô hình Thung lũng Silicon cũ chỉ ra rằng các công ty khởi nghiệp nên huy động một khoản tiền lớn từ các nhà đầu tư mạo hiểm, sau đó chi tiền thuê một đội ngũ nhân viên để mở rộng quy mô. Trong khi đó, Gamma vẫn kiếm được tiền và phát triển nhanh chóng dù không cần vốn tài trợ hay số lượng lớn nhân viên.

Những câu chuyện thành công này đã thu hút sự chú ý của Thung lũng Silicon. Anysphere, một công ty khởi nghiệp tạo ra phần mềm mã hóa Cursor, đạt doanh thu 100 triệu USD trong vòng chưa đầy hai năm với chỉ 20 nhân viên. ElevenLabs, một công ty A.I. công ty khởi nghiệp bằng giọng nói, cũng làm nên kỳ tích tương tự với khoảng 50 nhân sự.

Khả năng A.I. cho phép các công ty khởi nghiệp làm được nhiều việc hơn với ít nhân viên hơn đã dẫn đến những suy đoán hoang đường về tương lai. Sam Altman, giám đốc điều hành của OpenAI, dự đoán rằng một ngày nào đó có thể có một công ty một người trị giá 1 tỷ USD.

Với các công cụ A.I., một số công ty khởi nghiệp hiện đang tuyên bố ngừng tuyển dụng ở một quy mô nhất định. Runway Financial, một công ty phần mềm tài chính, cho biết chỉ tuyển tối đa 100 nhân viên vì mỗi người sẽ tăng năng suất gấp rưỡi. Agency, startup sử dụng A.I. cho dịch vụ khách hàng, cũng có kế hoạch tuyển dụng không quá 100 nhân viên.

“Mục đích là loại bỏ những vai trò không cần thiết”, Elias Torres, người sáng lập Agency, cho biết.

Ý tưởng này được thúc đẩy bởi DeepSeek, công ty khởi nghiệp A.I. của Trung Quốc xây dựng các công cụ trí tuệ nhân tạo với chi phí chỉ bằng một phần nhỏ so với chi phí thông thường. Bước đột phá, được xây dựng trên các công cụ nguồn mở có sẵn miễn phí trực tuyến, đã tạo ra sự bùng nổ của các công ty xây dựng sản phẩm mới giá rẻ.

“DeepSeek là một bước ngoặt”, Gaurav Jain, một nhà đầu tư tại công ty đầu tư mạo hiểm Afore Capital, đơn vị đã hỗ trợ Gamma, cho biết. “Chi phí điện toán sẽ giảm rất, rất nhanh, rất nhanh”.

Ông Jain so sánh các công ty khởi nghiệp A.I. mới với làn sóng cuối những năm 2000, sau khi Amazon bắt đầu cung cấp các dịch vụ điện toán đám mây giá rẻ. Điều đó đã làm giảm chi phí thành lập công ty, dẫn đến một loạt các công ty khởi nghiệp mới có thể được xây dựng với chi phí rẻ.

Trước cơn sốt A.I. này, các công ty khởi nghiệp thường đốt 1 triệu USD để đạt được doanh thu 1 triệu USD. Bây giờ, để đạt được doanh thu 1 triệu USD, chi phí chỉ bằng 1/5 và cuối cùng có thể giảm xuống còn 1/10, theo phân tích của Afore đối với 200 công ty khởi nghiệp.

Ông Jain cho biết: “Lần này, chúng tôi đang tự động hóa con người chứ không chỉ tự động hóa các trung tâm dữ liệu”.

Tuy nhiên, nếu các công ty khởi nghiệp vẫn có thể có lãi mà không cần chi nhiều tiền, điều đó có thể trở thành vấn đề lớn đối với các nhà đầu tư mạo hiểm, những người phân bổ hàng chục tỷ USD để đầu tư vào các công ty khởi nghiệp A.I. Năm ngoái, các công ty A.I. đã huy động được 97 tỷ USD tiền tài trợ, chiếm 46% tổng số tiền đầu tư mạo hiểm tại Mỹ, theo PitchBook.

“Vốn đầu tư mạo hiểm chỉ hiệu quả nếu bạn rót tiền vào những người chiến thắng”, Terrence Rohan, một nhà đầu tư của Quỹ Otherwise, tập trung vào các công ty khởi nghiệp rất trẻ, cho biết.

“Nếu người chiến thắng trong tương lai cần ít tiền hơn, không biết dòng vốn đầu tư mạo hiểm sẽ ra sao?”.

Hiện tại, các nhà đầu tư vẫn tiếp tục đấu tranh để đầu tư vào các công ty đang phát triển mạnh nhất, nhiều công ty trong số đó không cần thêm tiền. Một số nhà đầu tư lạc quan rằng hiệu quả do A.I. thúc đẩy sẽ thôi thúc các doanh nhân thành lập nhiều công ty hơn, dẫn đến nhiều cơ hội đầu tư hơn. Họ hy vọng khi các công ty khởi nghiệp đạt đến một quy mô nhất định, họ sẽ áp dụng mô hình cũ là các nhóm lớn và tiền lớn.

Quay trở lại với Gamma.

Ông Lee cho biết ông đang có kế hoạch tăng gấp đôi lực lượng lao động trong năm nay lên 60, tuyển dụng cho bộ phận thiết kế, kỹ thuật và bán hàng. Nhân sự phải có kiến thức tổng quát có thể thực hiện nhiều nhiệm vụ thay vì một việc như trước đây. Theo ông Lee, mô hình hiệu quả với AI đã giúp giải phóng thời gian. Bây giờ ông chỉ việc tập trung tư vấn khách hàng và cải thiện sản phẩm.

“Đó thực sự là giấc mơ của mọi nhà sáng lập”, ông Lee nói.

Theo: Financial Times, WSJ

Hashtags: #StartupAI #CongNgheKhoiNghiep #KinhDoanhCongNghe #AIKhaiPha #StartupCongNghe

Nguồn: markettimes.vn / 21-Feb-2025 / https://markettimes.vn/deepseek-khoi-phat-ky-nguyen-startup-gia-re-chi-20-nhan-su-cung-tao-ra-hang-chuc-trieu-usd-cac-cong-ty-khong-con-khat-tien-mat-77486.html

Công nghệ

WikiTok: Cánh cửa mới khám phá Wikipedia

Published

2 tháng ago

21 Tháng 2, 2025

Dieter R.

Nghe đọc bài

WikiTok – Ứng dụng hiển thị bài viết Wikipedia ngẫu nhiên, có thể là giải pháp cho thói quen lướt web tiêu cực.

Nếu bạn, cũng như tôi, trải qua những năm tháng định hình trên internet vào giữa thập niên 2000, chắc hẳn bạn đã từng nghe đến StumbleUpon. Trang web này có thể coi là tiền thân của ứng dụng WikiTok đang gây sốt hiện nay.

Illustration: Inc.; Photo: Getty Images / Inc

StumbleUpon, hoạt động từ 2001 đến 2018, cho phép người dùng nhập các sở thích và sau đó đề xuất các trang web ngẫu nhiên liên quan. Chỉ cần nhấn nút “StumbleUpon”, bạn sẽ bắt đầu hành trình khám phá những điều thú vị trên internet – từ nghệ sĩ vẽ phấn trên vỉa hè đến bài nghiên cứu học thuật về luật hải tặc.

Thời sinh viên, tôi dành gần như toàn bộ thời gian trong lớp để lướt qua các trang web này. Rồi tôi lớn lên, đi làm, và StumbleUpon ngừng hoạt động vào năm 2018. Tuy nhiên, đến năm 2025, một công cụ giải trí mới đã xuất hiện, mang tính giáo dục cao hơn. Đó chính là WikiTok.

Mặc dù tên gọi gợi nhớ đến ứng dụng video TikTok, nhưng WikiTok lại có cách hoạt động tương tự StumbleUpon. Điểm khác biệt là thay vì hiển thị bất kỳ trang web nào trên internet, WikiTok chỉ tập trung vào các bài viết Wikipedia.

Bạn có thể truy cập WikiTok qua trình duyệt di động. Khi tìm kiếm, bạn sẽ thấy một hình ảnh đẹp mắt kèm đoạn mở đầu của một bài viết Wikipedia – có thể là về một nhân vật, địa điểm hoặc sự vật thú vị nào đó. Bạn có thể chọn đọc thêm hoặc vuốt lên để xem bài tiếp theo. WikiTok cũng có phiên bản máy tính, nhưng trải nghiệm người dùng chưa được tối ưu lắm.

Nhà phát triển Isaac Gemal đã công bố mã nguồn của WikiTok trên GitHub. Hiện có một số ứng dụng cùng tên trên App Store và Google Play, nhưng chúng không liên quan đến WikiTok gốc.

“Tôi không có kế hoạch biến nó thành một thuật toán phức tạp như TikTok để kiếm tiền,” Gemal chia sẻ với Ars Technica. “Nếu có, nó là một ứng dụng chống lại thuật toán.” Đó chính là điểm đặc biệt mà Gemal muốn gìn giữ.

Không giống TikTok gây nghiện cao độ hay StumbleUpon đề xuất nội dung dựa trên sở thích, WikiTok không nhằm mục đích giữ chân người dùng. Nó hoàn toàn ngẫu nhiên. Có những bài viết sẽ khiến bạn thích thú, nhưng cũng có những bài khiến bạn chán ngắt.

Gemal không muốn tạo ra một thuật toán khiến người dùng dính chặt vào ứng dụng, ông cũng không có ý định kiếm tiền từ nền tảng này. Người dùng có thể đọc thoải mái, và khi gặp một bài không hứng thú – chẳng hạn như về thị trấn Pleasant Hill, Ohio, hay một loài bướm đêm nào đó – họ có thể thoải mái rời đi. Tuy nhiên, trong quá trình sử dụng, người dùng sẽ học được nhiều điều thú vị về lịch sử, địa lý, nhân vật chính trị, người nổi tiếng và các kiến thức tạp nham khác – những thông tin có thể hữu ích cho một thí sinh Jeopardy! tương lai chẳng hạn.

Là một người có nhiều thời gian rảnh rỗi, tôi tò mò không biết phải mất bao lâu để tìm ra trang Wikipedia dẫn nhanh nhất đến trò chơi “Six Degrees of Kevin Bacon” (Sáu bước tới Kevin Bacon).

Hashtags: #WikiTok #KhamPhaWikipedia #LuotWebNgauNhien #KhamPhaTrucTuyen #RandomLearning #DigitalExploration

Keyword: WikiTok khám phá Wikipedia

Nguồn: Inc / FEB 13, 2025 / https://www.inc.com/sarah-sicard/stumbleupon-walked-so-wikitok-could-run/91147304