KH - Công Nghệ

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google

Tóm tắt:

  • OpenAI ra mắt hai mô hình lý luận mới là o3 và o4-mini, tập trung vào tư duy nội bộ.

  • Các mô hình này vượt trội về khả năng phân tích, xử lý hình ảnh và sử dụng công cụ trực tiếp.

  • o3 đạt kết quả cao trong các bài kiểm tra toán học, lập trình, suy luận logic và hình ảnh.

  • o4-mini cân bằng giữa chi phí, tốc độ và hiệu suất, có phiên bản tăng độ tin cậy o4-mini-high.

  • Các mô hình mới giúp OpenAI nâng cao khả năng cạnh tranh trong thị trường AI toàn cầu.

Trong nỗ lực không ngừng nâng cao khả năng của trí tuệ nhân tạo, OpenAI đã giới thiệu o3 và o4-mini, hai mô hình AI mới thuộc dòng "lý luận". Khác với các mô hình tạo sinh thông thường trả lời gần như tức thì, các mô hình lý luận này được lập trình để thực hiện một chuỗi tư duy nội bộ, phân tích và giải quyết vấn đề từng bước trước khi đưa ra câu trả lời cuối cùng, giúp tăng độ chính xác và khả năng xử lý các yêu cầu phức tạp.

OpenAI gọi o3 là mô hình lý luận tiên tiến nhất từ trước đến nay của hãng, khẳng định nó vượt trội hơn các mô hình trước đó trong các bài kiểm tra đo lường khả năng toán học, lập trình, suy luận logic, khoa học và cả hiểu biết về hình ảnh. Trong khi đó, o4-mini được định vị là lựa chọn cân bằng tối ưu giữa chi phí, tốc độ và hiệu năng – những yếu tố quan trọng mà các nhà phát triển thường cân nhắc khi chọn mô hình AI cho ứng dụng của mình. Bên cạnh đó, còn có biến thể o4-mini-high, một phiên bản của o4-mini dành nhiều thời gian xử lý hơn để tăng độ tin cậy cho câu trả lời.

Năng lực mới vượt trội

Một bước tiến lớn của o3 và o4-mini so với các mô hình lý luận trước đây là khả năng sử dụng trực tiếp các công cụ có sẵn trong ChatGPT để tạo phản hồi. Chúng có thể tự động duyệt web để tìm thông tin mới nhất, thực thi mã Python thông qua tính năng Canvas, xử lý hình ảnh và thậm chí tạo ra hình ảnh mới.

Đặc biệt, o3 và o4-mini là những mô hình đầu tiên của OpenAI có khả năng "suy nghĩ bằng hình ảnh" (think with images). Người dùng có thể tải lên các hình ảnh như bản phác thảo trên bảng trắng hay sơ đồ từ file PDF, và các mô hình này sẽ phân tích chúng trong quá trình "suy nghĩ" của mình trước khi trả lời. Chúng có thể hiểu được cả những hình ảnh mờ, chất lượng thấp và thực hiện các thao tác như phóng to, xoay ảnh trong khi đang lý luận.

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 1.

Các mô hình mới của OpenAI có khả năng lập luận từ hình ảnh. Ảnh: OpenAI

Hiệu năng ấn tượng và giá cả cạnh tranh

Về hiệu năng, OpenAI cho biết o3 đạt kết quả hàng đầu (state-of-the-art) trong bài kiểm tra năng lực lập trình SWE-bench verified với điểm số 69.1%. Mô hình o4-mini cũng đạt hiệu năng tương tự với 68.1%, vượt xa đáng kể so với mô hình o3-mini trước đó (49.3%) và cả đối thủ Claude 3.7 Sonnet (62.3%).

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 2.

o3 và o4-mini có hiệu năng vượt trội so với các mô hình cũ của OpenAI. Ảnh: OpenAI

Bối cảnh cạnh tranh

Việc ra mắt o3 và o4-mini diễn ra trong bối cảnh cuộc đua AI toàn cầu ngày càng khốc liệt. Sau khi OpenAI tiên phong với mô hình lý luận o1, các đối thủ như Google, Meta, xAI, Anthropic, DeepSeek đã nhanh chóng tung ra các phiên bản cạnh tranh, thậm chí vượt trội hơn. Các mô hình lý luận đang dần trở thành xu thế chủ đạo. Đáng chú ý, CEO Sam Altman vào tháng 2 từng úp mở về việc tập trung nguồn lực cho một giải pháp phức tạp hơn thay vì phát hành o3 độc lập, nhưng áp lực cạnh tranh dường như đã khiến OpenAI thay đổi quyết định.

Hiện tại, người dùng các gói ChatGPT Pro, Plus và Team đã có thể trải nghiệm o3, o4-mini và o4-mini-high. Trong vài tuần tới, OpenAI dự kiến phát hành thêm o3-pro, phiên bản mạnh hơn của o3 dành riêng cho thuê bao ChatGPT Pro.

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 3.

Người dùng gói Plus, Pro đã có thể trải nghiệm o3 và o4-mini trên ChatGPT

Sam Altman cũng đã úp mở rằng o3 và o4-mini có thể là những mô hình lý luận độc lập cuối cùng xuất hiện trên ChatGPT trước khi GPT-5 ra mắt. Mô hình thế hệ tiếp theo này được kỳ vọng sẽ hợp nhất khả năng của các mô hình truyền thống (như GPT-4.1) với các mô hình lý luận tiên tiến, tạo ra một bước nhảy vọt mới về năng lực AI.

Sự xuất hiện của o3 và o4-mini rõ ràng đã nâng cấp đáng kể khả năng suy luận, xử lý đa phương thức và tích hợp công cụ của ChatGPT, giúp OpenAI củng cố vị thế cạnh tranh và đồng thời hé lộ những bước đi tiếp theo hướng tới các mô hình AI toàn diện và mạnh mẽ hơn trong tương lai.

Theo The Verge


Các tin khác

Trụ sở Huawei ở Quảng Đông: Châu Âu thu nhỏ, xịn như khu nghỉ dưỡng 5 sao, sức chứa lên tới 25.000 nhân viên

Trụ sở Huawei ở Quảng Đông: Châu Âu thu nhỏ, xịn như khu nghỉ dưỡng 5 sao, sức chứa lên tới 25.000 nhân viên

Huawei đã đầu tư 2 tỷ USD để xây dựng một "Châu Âu thu nhỏ" tại cơ sở hồ Tùng Sơn, thành phố Đông Quan, tỉnh Quảng Đông. Nó còn có một cái tên khá đẹp - "Làng Suối Sau Đồi", nhân viên Huawei thường gọi nơi này là "Làng Suối". Với nhân viên Huawei, đây đích thực là thế giới cổ tích để làm việc và sáng tạo.
VNPT tiên phong triển khai GSMA Open Gateway, góp phần thúc đẩy chuyển đổi số quốc gia

VNPT tiên phong triển khai GSMA Open Gateway, góp phần thúc đẩy chuyển đổi số quốc gia

Ngày 15/4/2025 – Trong khuôn khổ Hội nghị Thượng đỉnh các Quốc gia Số GSMA tổ chức tại Hà Nội, Tập đoàn Bưu chính Viễn thông Việt Nam (VNPT) tham gia Lễ công bố ký kết Biên bản Ghi nhớ với Hiệp hội Di động Thế giới (GSMA), chính thức tham gia triển khai dịch vụ API theo sáng kiến GSMA Open Gateway.