Theo tờ Wired, Nvidia hiện là "vị vua" không thể tranh cãi của đế chế chip AI. Thế nhưng, nhờ chính công nghệ AI mà họ góp công xây dựng, vị trí dẫn đầu này này có thể sớm đối mặt với sự cạnh tranh ngày càng gay gắt.
Các hệ thống AI hiện đại ngày nay đều vận hành trên những thiết kế của Nvidia, một động lực mang tính quyết định đã đẩy vốn hóa thị trường của công ty này vượt xa ngưỡng 4.000 tỷ USD.
Mỗi thế hệ chip mới của Nvidia cho phép các tập đoàn huấn luyện những mô hình AI mạnh mẽ hơn bằng cách kết nối hàng trăm hoặc hàng nghìn bộ xử lý thông qua mạng lưới bên trong các trung tâm dữ liệu khổng lồ.
Một lý do quan trọng đằng sau thành công của Nvidia là việc họ cung cấp phần mềm hỗ trợ lập trình cho từng thế hệ chip mới. Tuy nhiên, kỹ năng đặc thù này có thể sẽ không còn là một lợi thế quá khác biệt trong tương lai gần.
“Vũ khí bí mật” của Nvidia bắt đầu lung lay
Một startup mang tên Wafer đang huấn luyện các mô hình AI để đảm nhận một trong những công việc khó khăn và quan trọng nhất: tối ưu hóa mã nguồn sao cho phần mềm chạy hiệu quả nhất có thể trên một chip silicon cụ thể.
Emilio Andere, đồng sáng lập kiêm CEO của Wafer, cho biết công ty đang thực hiện phương pháp học tăng cường trên các mô hình mã nguồn mở để dạy chúng cách viết mã kernel, loại phần mềm tương tác trực tiếp với phần cứng trong hệ điều hành.
Ông Andere tiết lộ thêm rằng Wafer cũng tích hợp các "hệ thống đại lý thông minh" vào các mô hình lập trình hiện có như Claude của Anthropic hay GPT của OpenAI để nâng cấp khả năng viết mã chạy trực tiếp trên chip của chúng.
Hiện nay, nhiều tập đoàn công nghệ hàng đầu đã sở hữu những dòng chip riêng. Apple và các đối thủ khác từ nhiều năm nay đã sử dụng silicon tùy chỉnh để nâng cao hiệu suất và hiệu quả của phần mềm chạy trên laptop, máy tính bảng và điện thoại thông minh.
Ở một quy mô khác, các gã khổng lồ như Google và Amazon cũng tự đúc silicon riêng để tối ưu hóa hiệu suất cho các nền tảng điện toán đám mây. Meta gần đây cũng tuyên bố sẽ triển khai công suất tính toán lên tới 1 GW bằng loại chip mới được phát triển cùng Broadcom.
Việc triển khai silicon tùy chỉnh luôn đòi hỏi phải viết một khối lượng mã nguồn khổng lồ để đảm bảo phần mềm vận hành trơn tru và hiệu quả trên bộ vi xử lý mới.
Wafer đang hợp tác với các đối tác lớn bao gồm AMD và Amazon để giúp tối ưu hóa phần mềm chạy hiệu quả trên phần cứng của họ. Cho đến nay, startup này đã huy động được 4 triệu USD vốn hạt giống từ Jeff Dean của Google, Wojciech Zaremba của OpenAI và nhiều tên tuổi lẫy lừng khác.
Andere tin rằng cách tiếp cận dựa trên AI của công ty mình có tiềm năng thách thức vị thế thống trị của Nvidia. Một số dòng chip cao cấp hiện nay đã đạt đến hiệu suất tính toán dấu phẩy động thô (floating point performance), một chuẩn mực quan trọng để đánh giá khả năng thực hiện các phép tính đơn giản của chip, tương đương với những dòng silicon tốt nhất của Nvidia.
"Phần cứng tốt nhất của AMD, hệ thống [Amazon] Trainium tốt nhất, hay các chip [Google] TPU tốt nhất, đều mang lại các chỉ số flops lý thuyết ngang ngửa với GPU của Nvidia," Andere chia sẻ gần đây, "Mục tiêu của chúng tôi là tối đa hóa trí thông minh trên mỗi watt điện năng tiêu thụ."
Andere cho rằng các kỹ sư hiệu suất, những người sở hữu kỹ năng tối ưu hóa mã nguồn để chạy ổn định và hiệu quả trên chip, hiện vô cùng đắt đỏ và khan hiếm, trong khi hệ sinh thái phần mềm của Nvidia lại giúp việc viết và bảo trì mã cho chip của họ trở nên quá dễ dàng. Điều đó khiến ngay cả những công ty công nghệ lớn nhất cũng gặp khó khăn nếu muốn "đơn thương độc mã" trên con đường này.
Chẳng hạn, khi Anthropic hợp tác với Amazon để xây dựng các mô hình AI trên nền tảng Trainium, họ đã phải viết lại toàn bộ mã nguồn của mô hình từ đầu để đảm bảo nó vận hành hiệu quả nhất trên phần cứng đó, Andere cho biết.
Tất nhiên, Claude của Anthropic hiện là một trong số nhiều mô hình AI đã đạt đến trình độ "siêu nhân" trong việc lập trình. Vì vậy, Andere dự đoán sẽ không còn lâu nữa trước khi AI bắt đầu "ăn mòn" lợi thế phần mềm của Nvidia.
"Con hào ngăn cách nằm ở khả năng lập trình của con chip," Andere nói, đề cập đến các thư viện và công cụ phần mềm giúp tối ưu hóa mã cho phần cứng Nvidia dễ dàng hơn. "Tôi nghĩ đã đến lúc phải đặt câu hỏi liệu đó có thực sự là một con hào vững chắc hay không."
AI tự thiết kế chip, cuộc chơi có thể đảo chiều
Bên cạnh việc đơn giản hóa quá trình tối ưu hóa mã nguồn cho các loại silicon khác nhau, AI có thể sớm giúp việc thiết kế chính các con chip trở nên thuận tiện hơn.
Ricursive Intelligence, một startup được thành lập bởi hai cựu kỹ sư Google là Azalia Mirhoseini và Anna Goldie, đang phát triển những phương thức mới để thiết kế chip máy tính bằng trí tuệ nhân tạo.
Nếu công nghệ này thành công, sẽ có thêm rất nhiều công ty lấn sân sang lĩnh vực thiết kế chip, tạo ra những silicon tùy chỉnh giúp vận hành phần mềm của họ hiệu quả hơn.
Các thiết kế của Nvidia đóng vai trò sống còn đối với AI hiện đại, với mỗi thế hệ chip mới cho phép các công ty huấn luyện những mô hình AI mạnh mẽ hơn bằng cách kết nối hàng trăm hoặc hàng nghìn bộ xử lý với nhau trong các trung tâm dữ liệu khổng lồ.
Khi còn ở Google, Mirhoseini và Goldie đã phát triển một phương thức để AI tối ưu hóa bố cục của các thành phần then chốt trên chip máy tính. Phương pháp này đã thay đổi hoàn toàn cách Google thiết kế các bộ vi xử lý của riêng mình, và hiện đang được sử dụng rộng rãi trong toàn ngành để giúp sắp xếp các tính năng trên các loại chip khác nhau.
Tuy nhiên, Ricursive đặt mục tiêu tiến xa hơn bằng cách tự động hóa nhiều yếu tố hơn nữa trong thiết kế chip và tích hợp các mô hình ngôn ngữ lớn vào quy trình.
Mục tiêu cuối cùng là cho phép các kỹ sư sử dụng ngôn ngữ tự nhiên để mô tả các thay đổi hoặc đặt câu hỏi về một con chip. Giống như cách người ta có thể "vibe code" một ứng dụng, có lẽ một ngày nào đó chúng ta có thể "vibe design" cả một con chip.
Ricursive vẫn đang trong giai đoạn phát triển công nghệ, nhưng Mirhoseini khẳng định công ty đã chứng minh được khả năng tối ưu hóa nhiều khía cạnh hơn trong thiết kế chip.
Triển vọng tự động hóa quy trình thiết kế chip theo cách này đã khiến giới đầu tư "phát sốt": Ricursive đã huy động được 335 triệu USD với mức định giá 4 tỷ USD chỉ sau vài tháng ngắn ngủi.
Goldie tin rằng cuối cùng AI có thể đồng thiết kế cả chip lẫn thuật toán để giúp chúng trở nên mạnh mẽ hơn nữa. Cô cho rằng việc để AI tinh chỉnh chính silicon và mã nguồn của mình có thể tạo ra một vòng lặp cải tiến AI mang tính đệ quy (recursive).
"Chúng ta đang tiến vào một kỷ nguyên mới, nơi chúng ta có thể đầu tư thêm năng lực tính toán để thiết kế những con chip nhanh hơn và tốt hơn, tạo ra một kiểu định luật quy mô hoàn toàn mới cho việc thiết kế chip", cô Goldie nói.
"Chúng tôi đang nhắm vào những 'nút thắt' khó khăn nhất của quy trình thiết kế chip, bao gồm thiết kế vật lý và xác minh thiết kế," Mirhoseini, hiện cũng là trợ lý giáo sư tại Đại học Stanford, chia sẻ khi đề cập đến hai thách thức cốt lõi trong thiết kế chip.
Thiết kế chip máy tính là một trong những công việc hệ trọng và phức tạp nhất hành tinh. Các kỹ sư chip phải tìm cách sắp xếp một số lượng khổng lồ các thành phần trên một miếng silicon để tối ưu hóa các chức năng khác nhau.
Sau khi một con chip được thiết kế xong, hiệu suất của nó phải được kiểm tra và xác minh cực kỳ cẩn thận thông qua quy trình lặp đi lặp lại trước khi bản thiết kế có thể được gửi đến xưởng đúc.
*Nguồn: Wired


