OpenAI lần đầu vận hành mô hình bằng chip không phải của

OpenAI lần đầu vận hành mô hình bằng chip không phải của Nvidia

OpenAI ra mắt mô hình GPT-5.3-Codex-Spark hỗ trợ lập trình, đánh dấu lần đầu triển khai hệ thống phần cứng từ Cerebras Systems thay vì Nvidia.

GPT-5.3-Codex-Spark là phiên bản rút gọn, tiết kiệm năng lượng của dòng Codex, được tối ưu hóa cho tác vụ lập trình nhanh và có khả năng tương tác liên tục. Hiện mô hình được cung cấp dưới dạng thử nghiệm cho người đăng ký gói ChatGPT Pro.

Đây là lần đầu công ty sở hữu ChatGPT đưa một mô hình vào vận hành thực tế trên nền tảng chip không phải của Nvidia. Phần cứng đứng sau sự thay đổi này là Wafer Scale Engine thế hệ thứ ba của Cerebras. Khác với cụm GPU thông thường được ghép nối từ nhiều chip nhỏ, kiến trúc của Cerebras sử dụng một tấm silicon khổng lồ chứa hàng trăm nghìn nhân xử lý AI, giúp giảm thiểu độ trễ và tối đa hóa tốc độ truyền tải dữ liệu vốn là điểm yếu trong tác vụ phản hồi thời gian thực.

OpenAI cho biết khi chạy trên hệ thống của Cerebras, GPT-5.3-Codex-Spark có thể đạt tốc độ xử lý hơn 1.000 token mỗi giây. Mô hình được tinh chỉnh để hỗ trợ lập trình viên chỉnh sửa từng đoạn mã cụ thể hoặc chạy các bài kiểm tra mục tiêu một cách nhanh chóng.

Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: Reuters — Siêu máy tính Andromeda của Cerebras đặt tại trung tâm dữ liệu ở Santa Clara (Mỹ) năm 2022. Ảnh: *Reuters*

Dù bắt đầu đa dạng hóa phần cứng, OpenAI vẫn khẳng định phụ thuộc vào Nvidia. Đầu tháng 2, CEO Sam Altman viết trên X rằng công ty "yêu thích hợp tác với Nvidia" và gọi đây là nhà sản xuất chip tốt nhất thế giới. Động thái của Altman dập tắt tin đồn rằng OpenAI đang không hài lòng với hiệu suất của một số dòng chip Nvidia. Thực tế, các mô hình mạnh mẽ nhất của OpenAI vẫn được đào tạo và vận hành chủ yếu trên hạ tầng của Nvidia.

Bắt tay với Cerebras là một phần trong kế hoạch mở rộng hệ sinh thái phần cứng của OpenAI. Tháng trước, công ty xác nhận ký thỏa thuận triển khai hạ tầng tính toán 750 MW với Cerebras kéo dài đến năm 2028. Ngoài ra, OpenAI cũng đã đồng ý mua lượng chip tương đương 6 GW từ AMD trong nhiều năm, đồng thời bắt tay với Broadcom để tự thiết kế các bộ tăng tốc AI và linh kiện mạng tùy chỉnh.

Hiện dòng mô hình Codex đã đạt hơn một triệu người dùng hoạt động hàng tuần. OpenAI dự kiến mở rộng quyền truy cập GPT-5.3-Codex-Spark cho nhiều nhóm người dùng hơn sau khi đánh giá kỹ lưỡng hiệu năng và nhu cầu thị trường.

(theo Tom's Hardware

OpenAI lần đầu vận hành mô hình bằng chip không phải của Nvidia

Tin xem nhiều

Warren Buffett cảnh báo khẩn tới toàn bộ nhà đầu tư: Hãy thận trọng, hiện giờ ai cũng chỉ thích đánh bạc!

Vụ tranh chấp thừa kế của cố diễn viên Đức Tiến: Chữ ký trên di chúc khác chữ ký mẫu

30.000 trường mầm non, tiểu học đóng cửa sau 1 năm, mỗi ngày nhân sự tại 60 cơ sở rơi vào cảnh thất nghiệp: Chuyện gì đang xảy ra tại Trung Quốc?

Thêm loạt thương hiệu kim cương đóng cửa

Vì sao chiếc quần jeans 89 USD của Hailey Bieber cháy hàng trong vài phút: Một case study về cách Gap "hồi sinh" bằng văn hóa đại chúng

Sản lượng chip nhớ Trung Quốc tăng trưởng phi mã, phả hơi nóng trực tiếp lên vị thế của Micron

Người TP.HCM ‘toát mồ hôi’ đi bán kim cương

Bị tố làm khách bị ngộ độc, PHẢI ĐI CẤP CỨU vì NHIỄM TRÙNG ĐƯỜNG RUỘT: Đại diện Nollowa Chicken Thụy Khuê (Hà Nội) nói gì?

Ngân hàng bắt đầu đóng tài khoản có số dư dưới 20.000 đồng

Apple vượt Nvidia, trở lại ngôi vương vốn hóa thế giới

Các tin khác