- 🚀 AWS đã ra mắt các chip AI mới cạnh tranh với GPU của Nvidia.
- 💻 AWS cho biết mục tiêu của họ là cung cấp thêm lựa chọn cho khách hàng, không phải để hạ bệ Nvidia trong thị trường chip AI.
- 🤝 Gadi Hutt, một giám đốc cấp cao tại AWS, cũng đã nói về các hợp tác với Intel, Anthropic và AMD.
Amazon Web Services đã ra mắt một dòng chip AI nâng cấp trong tuần này, đặt công ty vào vị trí cạnh tranh trực tiếp với Nvidia. Tuy nhiên, AWS không nhìn nhận vấn đề theo cách đó.
Gadi Hutt, giám đốc cấp cao phụ trách kỹ thuật khách hàng và sản phẩm tại công ty con thiết kế chip của AWS, Annapurna Labs, cho biết các chip AI mới của AWS không nhằm mục đích cạnh tranh trực tiếp với Nvidia. Mục tiêu là cung cấp cho khách hàng một lựa chọn có chi phí thấp hơn, vì thị trường đủ lớn cho nhiều nhà cung cấp, Hutt chia sẻ trong một cuộc phỏng vấn với Business Insider tại hội nghị re:Invent của AWS.
“Đây không phải là về việc lật đổ Nvidia,” Hutt nói, và thêm rằng, “Đây thực sự là về việc mang đến cho khách hàng những lựa chọn.”
AWS đã chi hàng chục tỷ đô la cho trí tuệ nhân tạo tạo sinh. Tuần này, công ty đã công bố chip AI tiên tiến nhất của mình, có tên là Trainium 2, có chi phí thấp hơn khoảng 40% so với GPU của Nvidia, và một cụm siêu máy tính mới sử dụng các chip này, được gọi là Project Rainier. Các phiên bản trước đây của chip AI của AWS đã có kết quả không đồng đều.
Hutt khẳng định rằng đây không phải là một cuộc cạnh tranh mà là một nỗ lực chung nhằm mở rộng quy mô tổng thể của thị trường. Hồ sơ khách hàng và khối lượng công việc AI mà họ nhắm đến cũng khác nhau. Ông còn nói thêm rằng các GPU của Nvidia sẽ vẫn giữ vị trí thống trị trong tương lai gần.
Trong cuộc phỏng vấn, Hutt đã thảo luận về sự hợp tác giữa AWS và Anthropic, công ty dự kiến sẽ là khách hàng đầu tiên của Dự án Rainer. Hai công ty đã làm việc chặt chẽ với nhau trong năm qua, và gần đây Amazon đã đầu tư thêm 4 tỷ đô la vào công ty khởi nghiệp AI này.
Ông cũng chia sẻ suy nghĩ của mình về mối quan hệ đối tác giữa AWS và Intel, công ty mà CEO Pat Gelsinger vừa mới nghỉ hưu. Ông nói rằng AWS sẽ tiếp tục làm việc với gã khổng lồ chip đang gặp khó khăn này vì nhu cầu của khách hàng đối với các chip máy chủ của Intel vẫn còn cao.
Năm ngoái, AWS đã nói rằng họ đang cân nhắc việc bán các chip AI mới của AMD. Tuy nhiên, Hutt cho biết những chip này vẫn chưa có sẵn trên AWS vì khách hàng chưa thể hiện nhu cầu mạnh mẽ.
Phần hỏi đáp này đã được chỉnh sửa để đảm bảo rõ ràng và ngắn gọn.
There have been a lot of headlines saying Amazon is out to get Nvidia with its new AI chips. Can you talk about that?
Đã có rất nhiều tiêu đề nói rằng Amazon đang nhắm vào Nvidia với các chip AI mới của mình. Bạn có thể nói về điều đó không?
Tôi thường xem những tiêu đề này và cười khúc khích một chút vì thực sự, nó không phải là về việc hạ bệ Nvidia. Nvidia là một đối tác rất quan trọng đối với chúng tôi. Thực sự là về việc mang đến cho khách hàng nhiều lựa chọn hơn.
Chúng ta còn nhiều việc phải làm để đảm bảo rằng chúng ta liên tục cho phép nhiều khách hàng hơn có khả năng sử dụng những con chip này. Và Nvidia không hề đi đâu cả. Họ có một giải pháp tốt và một lộ trình vững chắc. Chúng tôi vừa mới công bố các phiên bản P6 [máy chủ AWS với GPU Blackwell mới nhất của Nvidia], vì vậy cũng có sự đầu tư liên tục vào dòng sản phẩm của Nvidia. Điều này thực sự là để mang lại cho khách hàng nhiều lựa chọn. Không có gì hơn thế.
Nvidia là một nhà cung cấp tuyệt vời của AWS, và khách hàng của chúng tôi rất yêu thích Nvidia. Tôi sẽ không đánh giá thấp Nvidia dưới bất kỳ hình thức nào.
So you want to see Nvidia’s use case increase on AWS?
Vậy bạn muốn thấy trường hợp sử dụng của Nvidia tăng lên trên AWS?
Nếu khách hàng tin rằng đó là cách họ cần phải làm, thì họ sẽ làm theo. Tất nhiên, nếu điều đó tốt cho khách hàng, nó cũng sẽ tốt cho chúng tôi.
Thị trường rất lớn, vì vậy có chỗ cho nhiều nhà cung cấp ở đây. Chúng tôi không ép buộc bất kỳ ai phải sử dụng những con chip đó, nhưng chúng tôi đang nỗ lực rất nhiều để đảm bảo rằng các nguyên tắc chính của chúng tôi, đó là hiệu suất cao và chi phí thấp hơn, sẽ được hiện thực hóa để mang lại lợi ích cho khách hàng của chúng tôi.
Does it mean AWS is OK being in second place?
Điều đó có nghĩa là AWS chấp nhận ở vị trí thứ hai?
Đây không phải là một cuộc thi. Không có lễ trao giải học máy nào được tổ chức hàng năm cả.
Trong trường hợp của một khách hàng như Anthropic, có bằng chứng khoa học rất rõ ràng rằng cơ sở hạ tầng tính toán lớn hơn cho phép bạn xây dựng các mô hình lớn hơn với nhiều dữ liệu hơn. Và nếu bạn làm điều đó, bạn sẽ đạt được độ chính xác cao hơn và hiệu suất tốt hơn.
Khả năng của chúng tôi trong việc mở rộng công suất lên hàng trăm nghìn chip Trainium 2 mang đến cho họ cơ hội để đổi mới những điều mà trước đây họ không thể làm được. Họ đạt được mức tăng năng suất gấp 5 lần.
Is being No. 1 important?
Việc trở thành số 1 có quan trọng không?
Thị trường đủ lớn. Vị trí số 2 là một vị trí rất tốt để đạt được.
Tôi không nói rằng mình là số 2 hay số 1 đâu nhé. Nhưng đó thực sự không phải là điều tôi đang nghĩ đến. Chúng ta vẫn còn rất sớm trong hành trình của mình trong lĩnh vực học máy nói chung, trong ngành công nghiệp nói chung, và cũng cả trong lĩnh vực chip cụ thể, chúng tôi chỉ đang tập trung phục vụ các khách hàng như Anthropic, Apple và tất cả các khách hàng khác.
Chúng tôi thậm chí không làm phân tích cạnh tranh với Nvidia. Tôi không chạy các bài kiểm tra hiệu năng so với Nvidia. Tôi không cần phải làm vậy.
Ví dụ, có MLPerf, một tiêu chuẩn đánh giá hiệu suất trong ngành. Các công ty tham gia vào MLPerf có các kỹ sư hiệu suất làm việc chỉ để cải thiện các chỉ số MLPerf.
Đó hoàn toàn là một sự phân tâm đối với chúng tôi. Chúng tôi không tham gia vào điều đó vì chúng tôi không muốn lãng phí thời gian vào một tiêu chuẩn đánh giá không tập trung vào khách hàng.
On the surface, it seems like helping companies grow on AWS isn’t always beneficial for AWS’s own products because you’re competing with them?
Nhìn bề ngoài, có vẻ như việc giúp các công ty phát triển trên AWS không phải lúc nào cũng có lợi cho các sản phẩm của chính AWS vì bạn đang cạnh tranh với họ?
Chúng tôi là cùng một công ty mà Netflix đang chạy tốt nhất trên đó, và chúng tôi cũng có Prime Video. Đó là một phần văn hóa của chúng tôi.
Tôi phải nói rằng có rất nhiều khách hàng vẫn đang sử dụng GPU. Nhiều khách hàng yêu thích GPU, và họ không có ý định chuyển sang Trainium trong tương lai gần. Và điều đó cũng không sao, bởi vì, một lần nữa, chúng tôi đang cung cấp cho họ các lựa chọn và họ quyết định những gì họ muốn làm.
Do you see these AI tools becoming more commoditized in the future?
Bạn có thấy những công cụ AI này sẽ trở nên phổ biến hơn trong tương lai không?
Tôi thực sự hy vọng vậy.
Khi chúng tôi bắt đầu việc này vào năm 2016, vấn đề là không có hệ điều hành nào cho học máy (machine learning). Vì vậy, chúng tôi thực sự phải phát minh ra tất cả các công cụ xung quanh những con chip này để làm cho chúng hoạt động cho khách hàng của chúng tôi một cách suôn sẻ nhất có thể.
Nếu học máy trở nên phổ biến ở cả phía phần mềm và phần cứng, đó là điều tốt cho tất cả mọi người. Điều đó có nghĩa là việc sử dụng những giải pháp đó trở nên dễ dàng hơn. Tuy nhiên, việc vận hành học máy một cách có ý nghĩa vẫn là một nghệ thuật.
What are some of the different types of workloads customers might want to run on GPUs versus Trainium?
Một số loại khối lượng công việc khác nhau mà khách hàng có thể muốn chạy trên GPU so với Trainium là gì?
GPU là bộ xử lý đa năng hơn cho học máy. Tất cả các nhà nghiên cứu và nhà khoa học dữ liệu trên thế giới đều biết cách sử dụng Nvidia khá tốt. Nếu bạn phát minh ra điều gì đó mới, nếu bạn làm điều đó trên GPU, thì mọi thứ sẽ hoạt động.
Nếu bạn phát minh ra điều gì đó mới trên các chip chuyên dụng, bạn sẽ phải đảm bảo công nghệ trình biên dịch hiểu được những gì bạn vừa xây dựng hoặc tạo ra kernel tính toán riêng cho khối lượng công việc đó. Chúng tôi chủ yếu tập trung vào các trường hợp sử dụng mà khách hàng nói với chúng tôi rằng, ‘Này, đây là những gì chúng tôi cần.’ Thường thì những khách hàng chúng tôi có được là những người đang thấy chi phí tăng lên là một vấn đề và đang cố gắng tìm kiếm các giải pháp thay thế.
So the most advanced workloads are usually reserved for Nvidia chips?
Vậy những khối lượng công việc tiên tiến nhất thường được dành riêng cho các chip của Nvidia?
Thông thường. Nếu các chuyên gia khoa học dữ liệu cần liên tục chạy các thí nghiệm, họ có thể sẽ làm điều đó trên một cụm GPU. Khi họ biết họ muốn làm gì, đó là lúc họ có nhiều lựa chọn hơn. Đó là nơi mà Trainium thực sự tỏa sáng, bởi vì nó mang lại hiệu suất cao với chi phí thấp hơn.
AWS CEO Matt Garman previously said the vast majority of workloads will continue to be on Nvidia?
CEO của AWS Matt Garman trước đây đã nói rằng phần lớn khối lượng công việc sẽ tiếp tục được thực hiện trên Nvidia?
Điều đó có lý. Chúng tôi mang lại giá trị cho những khách hàng có chi tiêu lớn và đang cố gắng tìm cách kiểm soát chi phí tốt hơn một chút. Khi Matt nói về phần lớn khối lượng công việc, ý anh ấy là chụp ảnh y tế, nhận dạng giọng nói, dự báo thời tiết, và tất cả các loại công việc mà chúng tôi không thực sự tập trung vào ngay bây giờ bởi vì chúng tôi có những khách hàng lớn yêu cầu chúng tôi làm những việc lớn hơn. Vì vậy, tuyên bố đó là hoàn toàn chính xác 100%.
Nói tóm lại, chúng tôi muốn tiếp tục là nơi tốt nhất cho GPU và, tất nhiên, cả Trainium khi khách hàng cần đến.
What has Anthropic done to help AWS in the AI space?
Anthropic đã làm gì để giúp AWS trong lĩnh vực AI?
Họ có những ý kiến rất mạnh mẽ về những gì họ cần, và họ quay lại với chúng tôi và nói, ‘Này, chúng ta có thể thêm tính năng A vào chip tương lai của bạn không?’ Đó là một cuộc đối thoại. Một số ý tưởng họ đưa ra thậm chí không khả thi để thực hiện trong một mảnh silicon. Chúng tôi thực sự đã triển khai một số ý tưởng, và đối với những ý tưởng khác, chúng tôi đã quay lại với một giải pháp tốt hơn.
Bởi vì họ là những chuyên gia trong việc xây dựng các mô hình nền tảng, điều này thực sự giúp chúng tôi tập trung vào việc xây dựng các chip thực sự giỏi trong những gì chúng làm.
Chúng tôi vừa công bố Dự án Rainier cùng nhau. Đây là một ai đó muốn sử dụng rất nhiều chip đó càng nhanh càng tốt. Đây không chỉ là một ý tưởng – chúng tôi thực sự đang xây dựng nó.
Can you talk about Intel? AWS’s Graviton chips are replacing a lot of Intel chips at AWS data centers.
Bạn có thể nói về Intel không? Các chip Graviton của AWS đang thay thế rất nhiều chip Intel tại các trung tâm dữ liệu của AWS.
Tôi sẽ sửa lại cho bạn ở đây. Graviton không thay thế x86. Không phải là chúng tôi đang loại bỏ x86 và đặt Graviton vào vị trí đó. Nhưng một lần nữa, theo nhu cầu của khách hàng, hơn 50% số lần triển khai CPU gần đây của chúng tôi là Graviton.
Điều đó có nghĩa là nhu cầu của khách hàng đối với Graviton đang tăng lên. Nhưng chúng tôi vẫn đang bán rất nhiều lõi x86 cho khách hàng của mình, và chúng tôi nghĩ rằng chúng tôi là nơi tốt nhất để làm điều đó. Chúng tôi không cạnh tranh với các công ty này, mà chúng tôi coi họ như những nhà cung cấp tốt, và chúng tôi có rất nhiều việc kinh doanh cần làm cùng nhau.
How important is Intel going forward?
Intel sẽ quan trọng như thế nào trong tương lai?
Họ chắc chắn sẽ tiếp tục là một đối tác tuyệt vời cho AWS. Có rất nhiều trường hợp sử dụng chạy rất tốt trên các lõi Intel. Chúng tôi vẫn đang triển khai chúng. Không có ý định dừng lại. Thực sự là theo nhu cầu của khách hàng.
Is AWS still considering selling AMD’s AI chips?
AWS có còn đang xem xét việc bán các chip AI của AMD không?
AMD là một đối tác tuyệt vời cho AWS. Chúng tôi bán rất nhiều CPU AMD cho khách hàng dưới dạng các phiên bản máy chủ ảo.
Dòng sản phẩm học máy luôn được xem xét. Nếu khách hàng thể hiện mạnh mẽ rằng họ cần nó, thì không có lý do gì để không triển khai nó.
And you’re not seeing that yet for AMD’s AI chips?
Và bạn chưa thấy điều đó đối với các chip AI của AMD?
Chưa.
How supportive are Amazon CEO Andy Jassy and Garman of the AI chip business?
CEO của Amazon Andy Jassy và Garman ủng hộ mảng kinh doanh chip AI như thế nào?
Họ rất ủng hộ. Chúng tôi gặp họ thường xuyên. Có rất nhiều sự tập trung từ ban lãnh đạo trong công ty để đảm bảo rằng những khách hàng cần giải pháp ML sẽ nhận được chúng.
Cũng có rất nhiều sự hợp tác trong công ty với các nhóm khoa học và dịch vụ đang xây dựng các giải pháp trên những con chip đó. Các nhóm khác trong Amazon, như Rufus, trợ lý AI có sẵn cho tất cả khách hàng Amazon, chạy hoàn toàn trên các chip Inferentia và Trainium.
Tác giả: Eugene Kim,
Link bài gốc: Amazon’s AI chip executive tells BI why Nvidia is not a competitor, how Anthropic helps, and what AMD needs | Bài được đăng vào Ngày 07 tháng 12 năm 2024 | www.businessinsider.com
Dịch giả: Dieter R – KenkAI Nhiều thứ hay
(*) Bản quyền bản dịch thuộc về Dieter R. Tuy nhiên, nội dung bài viết không phải do tôi tạo ra. Mọi khiếu nại về bản quyền (nếu có) xin vui lòng gửi email đến địa chỉ purchasevn@getkenka.com. Xin chân thành cảm ơn.
(**) Follow KenkAI Nhiều thứ hay để đọc các bài dịch khác và cập nhật thông tin bổ ích hằng ngày.
Để lại một bình luận