Công nghệ

DeepSeek lại gây chấn động thế giới với mô hình AI mới: Thông minh hơn, chạy được trên một GPU duy nhất

Ngành công nghiệp trí tuệ nhân tạo thế giới đang chứng kiến một cuộc cách mạng thầm lặng khi startup AI Trung Quốc DeepSeek vừa tung ra phiên bản cập nhật mô hình R1-0528 cùng với một biến thể nhỏ gọn có thể hoạt động trên chỉ một card đồ họa duy nhất, thách thức trực tiếp các ông lớn công nghệ Mỹ như OpenAI và Google.

Sự kiện này đánh dấu một bước ngoặt quan trọng trong cuộc đua AI toàn cầu, khi DeepSeek một lần nữa chứng minh rằng không nhất thiết phải đầu tư hàng tỷ đô la và sử dụng hàng chục card đồ họa siêu mạnh mới có thể tạo ra những mô hình AI đẳng cấp thế giới.

Phiên bản cập nhật R1-0528 mà DeepSeek công bố trên nền tảng Hugging Face được mô tả là một "nâng cấp nhỏ" nhưng mang lại những cải tiến đáng kể. Mô hình mới đã giảm tới 45-50% tỷ lệ "ảo giác" - hiện tượng AI tạo ra thông tin sai lệch hoặc không chính xác, đồng thời nâng cao khả năng xử lý các tác vụ phức tạp, đưa hiệu suất của nó gần hơn với các mô hình suy luận hàng đầu như o3 của OpenAI và Gemini 2.5 Pro của Google.

DeepSeek lại gây chấn động thế giới với mô hình AI mới: Thông minh hơn, chạy được trên một GPU duy nhất - Ảnh 1.

Điều đặc biệt ấn tượng hơn cả là phiên bản "chưng cất" DeepSeek-R1-0528-Qwen3-8B, được xây dựng dựa trên nền tảng mô hình Qwen3-8B của Alibaba. Trong khi mô hình R1 đầy đủ với 685 tỷ tham số cần khoảng một chục card đồ họa 80GB để vận hành, phiên bản nhỏ gọn này chỉ yêu cầu một GPU với 40-80GB RAM, tương đương với một card Nvidia H100 duy nhất.

Không chỉ tiết kiệm tài nguyên tính toán, mô hình nhỏ gọn này còn thể hiện hiệu suất vượt trội khi đánh bại Google Gemini 2.5 Flash trong bộ câu hỏi toán học thử thách AIME 2025 và gần như sánh ngang với mô hình Phi 4 reasoning plus mới nhất của Microsoft trong bài kiểm tra kỹ năng toán học HMMT.

Thành công của DeepSeek đang làm lung lay những niềm tin cơ bản về ngành AI. Trước đây, cộng đồng công nghệ tin rằng để phát triển AI tiên tiến cần phải có nguồn đầu tư khổng lồ và sức mạnh tính toán vượt trội. Tuy nhiên, startup có trụ sở tại Hàng Châu này đã chứng minh rằng có thể tạo ra các mô hình AI đẳng cấp thế giới với chi phí thấp hơn đáng kể.

DeepSeek lại gây chấn động thế giới với mô hình AI mới: Thông minh hơn, chạy được trên một GPU duy nhất - Ảnh 2.

Vô cùng nhỏ gọn nhưng hiệu năng của DeepSeek-R1-0528 vẫn ngang ngửa các mô hình AI tốt nhất hiện nay

Sự xuất hiện của R1 phiên bản đầu vào tháng Giêng đã tạo ra làn sóng toàn cầu, khiến cổ phiếu của các công ty công nghệ ngoài Trung Quốc giảm mạnh và buộc các đối thủ phải điều chỉnh chiến lược. Google đã giới thiệu các gói dịch vụ Gemini giảm giá, trong khi OpenAI cắt giảm chi phí và phát hành mô hình o3 Mini ít tốn tài nguyên tính toán hơn.

Phiên bản cập nhật mới không chỉ cải thiện khả năng suy luận mà còn mở rộng phạm vi ứng dụng. DeepSeek cho biết mô hình hiện có thể viết sáng tạo các bài luận, tiểu thuyết và nhiều thể loại khác, cùng với khả năng cải tiến trong việc tạo mã front-end và nhập vai. Những cải tiến này được phát hành dưới giấy phép MIT khoan dung, cho phép sử dụng thương mại không hạn chế.

Thành công của DeepSeek cũng mang ý nghĩa địa chính trị sâu sắc, khi nó chứng minh rằng các lệnh cấm xuất khẩu công nghệ của Mỹ nhằm kìm hãm sự phát triển AI của Trung Quốc không đạt được hiệu quả như mong đợi. Điều này đặt ra những câu hỏi lớn về hiệu quả của các biện pháp kiểm soát công nghệ trong bối cảnh toàn cầu hóa.

Hiện tại, DeepSeek vẫn được kỳ vọng sẽ phát hành mô hình R2 - người kế nhiệm của R1, mặc dù kế hoạch ban đầu cho tháng Năm đã bị hoãn lại. Với những thành tựu đã đạt được, startup AI này đang khẳng định vị thế của mình như một thế lực không thể bỏ qua trong cuộc đua công nghệ toàn cầu, đồng thời mở ra những khả năng mới cho việc dân chủ hóa công nghệ AI khi làm cho nó trở nên dễ tiếp cận hơn với những tổ chức có nguồn lực hạn chế.

Các tin khác

Những ai không nên ăn bưởi?

Bưởi giàu vitamin C, giúp giảm cân, đẹp da nhưng ăn bưởi sao cho đúng và tốt cho sức khỏe thì không phải ai cũng biết.

Giá vàng đồng loạt tăng

Sáng nay (6/6), giá vàng trong nước đồng loạt tăng trở lại. Theo đó, vàng miếng SJC tiến sát mốc 118 triệu đồng/lượng và duy trì cao hơn giá vàng nhẫn 1,2 - 4 triệu đồng/lượng, tùy từng thương hiệu vàng.

Kiểm tra đột xuất một Công ty

Lực lượng chức năng đã tạm giữ gần 4 tấn thực phẩm đông lạnh tại Công ty TNHH xuất nhập khẩu Thịnh Phát Food.

Giá vàng quay đầu giảm mạnh

Sáng nay (4/6), giá vàng trong nước quay đầu giảm mạnh. Theo đó, vàng miếng SJC lại quay về quanh mốc 117 triệu đồng/lượng.

Giá vàng tăng đồng loạt

9h30 sáng nay (3/6), Công ty Vàng bạc đá quý Sài Gòn niêm yết giá vàng miếng SJC 116 - 118 triệu đồng/lượng mua vào - bán ra, tăng 200.000 đồng/lượng so với đầu giờ sáng. Trong khi đó, giá vàng nhẫn được điều chỉnh tăng mạnh.

HCM57 TECHNOLOGY lọt top 10 Thương hiệu tín nhiệm châu Á 2025

Ngày 18/05/2025 vừa qua, Công ty TNHH HCM57 Technology đã vinh dự đón nhận hai danh hiệu danh giá: Top 10 Thương hiệu tín nhiệm hàng đầu châu Á 2025 và Sản phẩm & Dịch vụ chất lượng châu Á 2025 tại Lễ công bố “Thương Hiệu Tín Nhiệm Hàng Đầu Châu Á - Asia Top Brand Award” lần thứ 8 tổ chức tại Hội trường Thống Nhất (TP. Hồ Chí Minh).

Ủy ban Thường vụ Quốc hội xem xét đề án sắp xếp đơn vị hành chính cấp tỉnh năm 2025

Cùng với các dự án Luật Tổ chức chính quyền địa phương và Luật Cán bộ, công chức (sửa đổi), Ủy ban Thường vụ Quốc hội cũng sẽ cho ý kiến về đề án sắp xếp đơn vị hành chính cấp tỉnh năm 2025; xem xét, thông qua về nguyên tắc các nghị quyết về sắp xếp đơn vị hành chính cấp xã năm 2025.

Mỹ không rút lui khỏi cuộc chiến thuế quan: Chính quyền Trump quyết giữ lập trường cứng rắn

Bất chấp các phán quyết pháp lý và sự phản đối từ nhiều quốc gia, chính quyền của Tổng thống Donald Trump vẫn kiên định theo đuổi chính sách áp thuế với đối tác thương mại. Bộ trưởng Thương mại và nhiều quan chức cấp cao cho rằng thuế quan là công cụ sống còn để bảo vệ lợi ích quốc gia, đặc biệt trong các cuộc đàm phán căng thẳng với Trung Quốc và châu Âu.

Kiến nghị hủy ngăn chặn giao dịch chuyển nhượng tại khu đất vàng 132 Bến Vân Đồn

TAND TPHCM kiến nghị UBND TPHCM hủy bỏ các biện pháp ngăn chặn giao dịch chuyển nhượng tại khu đất số 132 Bến Vân Đồn (quận 4) với lý do Công ty CP Đầu tư Phú Mỹ Hưng là bên thứ 3 nhận chuyển nhượng quyền sử dụng đất và thực hiện dự án, đã được cơ quan có thẩm quyền cấp giấy chứng nhận quyền sử dụng đất, cấp phép thực hiện dự án Millennium và đã chuyển nhượng cho người mua tại dự án là các quan hệ và giao dịch dân sự độc lập.