Khoa học

OpenAI lần đầu vận hành mô hình bằng chip không phải của Nvidia

GPT-5.3-Codex-Spark là phiên bản rút gọn, tiết kiệm năng lượng của dòng Codex, được tối ưu hóa cho tác vụ lập trình nhanh và có khả năng tương tác liên tục. Hiện mô hình được cung cấp dưới dạng thử nghiệm cho người đăng ký gói ChatGPT Pro.

Đây là lần đầu công ty sở hữu ChatGPT đưa một mô hình vào vận hành thực tế trên nền tảng chip không phải của Nvidia. Phần cứng đứng sau sự thay đổi này là Wafer Scale Engine thế hệ thứ ba của Cerebras. Khác với cụm GPU thông thường được ghép nối từ nhiều chip nhỏ, kiến trúc của Cerebras sử dụng một tấm silicon khổng lồ chứa hàng trăm nghìn nhân xử lý AI, giúp giảm thiểu độ trễ và tối đa hóa tốc độ truyền tải dữ liệu vốn là điểm yếu trong tác vụ phản hồi thời gian thực.

OpenAI cho biết khi chạy trên hệ thống của Cerebras, GPT-5.3-Codex-Spark có thể đạt tốc độ xử lý hơn 1.000 token mỗi giây. Mô hình được tinh chỉnh để hỗ trợ lập trình viên chỉnh sửa từng đoạn mã cụ thể hoặc chạy các bài kiểm tra mục tiêu một cách nhanh chóng.

Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: Reuters

Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: Reuters

Dù bắt đầu đa dạng hóa phần cứng, OpenAI vẫn khẳng định phụ thuộc vào Nvidia. Đầu tháng 2, CEO Sam Altman viết trên X rằng công ty "yêu thích hợp tác với Nvidia" và gọi đây là nhà sản xuất chip tốt nhất thế giới. Động thái của Altman dập tắt tin đồn rằng OpenAI đang không hài lòng với hiệu suất của một số dòng chip Nvidia. Thực tế, các mô hình mạnh mẽ nhất của OpenAI vẫn được đào tạo và vận hành chủ yếu trên hạ tầng của Nvidia.

Bắt tay với Cerebras là một phần trong kế hoạch mở rộng hệ sinh thái phần cứng của OpenAI. Tháng trước, công ty xác nhận ký thỏa thuận triển khai hạ tầng tính toán 750 MW với Cerebras kéo dài đến năm 2028. Ngoài ra, OpenAI cũng đã đồng ý mua lượng chip tương đương 6 GW từ AMD trong nhiều năm, đồng thời bắt tay với Broadcom để tự thiết kế các bộ tăng tốc AI và linh kiện mạng tùy chỉnh.

Hiện dòng mô hình Codex đã đạt hơn một triệu người dùng hoạt động hàng tuần. OpenAI dự kiến mở rộng quyền truy cập GPT-5.3-Codex-Spark cho nhiều nhóm người dùng hơn sau khi đánh giá kỹ lưỡng hiệu năng và nhu cầu thị trường.

(theo Tom's Hardware

Các tin khác

Mỹ đã thừa nhận thất bại

Tình trạng tồi tệ của hạm đội tàu phá băng Mỹ đang cản trở Mỹ tham gia cuộc đua vào Bắc Cực.

Ngỡ ngàng lãi suất ngân hàng trước nghỉ Tết

Trước nghỉ Tết Nguyên đán, nhiều ngân hàng bất ngờ điều chỉnh giảm lãi suất tiết kiệm. Thậm chí lãi suất liên ngân hàng cũng giảm mạnh và có ngân hàng chủ động giảm lãi suất cho vay.

Hé lộ toan tính của ông Trịnh Văn Quyết sau cái bắt tay với CEO Boeing

Cuộc gặp gỡ cấp cao giữa nhà sáng lập Trịnh Văn Quyết và lãnh đạo Boeing Việt Nam tại trụ sở FLC Group đã chính thức tái khởi động mối quan hệ đối tác chiến lược, đồng thời mở ra hướng đi mới cho Bamboo Airways với kế hoạch khai thác dòng tàu bay thân hẹp 737 MAX.