OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google

OpenAI vừa tiếp tục cuộc đua AI khốc liệt bằng việc chính thức tung ra hai mô hình lý luận (reasoning models) thế hệ mới mang tên o3 và o4-mini.

Tóm tắt:

OpenAI ra mắt hai mô hình lý luận mới là o3 và o4-mini, tập trung vào tư duy nội bộ.

Các mô hình này vượt trội về khả năng phân tích, xử lý hình ảnh và sử dụng công cụ trực tiếp.

o3 đạt kết quả cao trong các bài kiểm tra toán học, lập trình, suy luận logic và hình ảnh.

o4-mini cân bằng giữa chi phí, tốc độ và hiệu suất, có phiên bản tăng độ tin cậy o4-mini-high.

Các mô hình mới giúp OpenAI nâng cao khả năng cạnh tranh trong thị trường AI toàn cầu.

Trong nỗ lực không ngừng nâng cao khả năng của trí tuệ nhân tạo, OpenAI đã giới thiệu o3 và o4-mini, hai mô hình AI mới thuộc dòng "lý luận". Khác với các mô hình tạo sinh thông thường trả lời gần như tức thì, các mô hình lý luận này được lập trình để thực hiện một chuỗi tư duy nội bộ, phân tích và giải quyết vấn đề từng bước trước khi đưa ra câu trả lời cuối cùng, giúp tăng độ chính xác và khả năng xử lý các yêu cầu phức tạp.

OpenAI gọi o3 là mô hình lý luận tiên tiến nhất từ trước đến nay của hãng, khẳng định nó vượt trội hơn các mô hình trước đó trong các bài kiểm tra đo lường khả năng toán học, lập trình, suy luận logic, khoa học và cả hiểu biết về hình ảnh. Trong khi đó, o4-mini được định vị là lựa chọn cân bằng tối ưu giữa chi phí, tốc độ và hiệu năng – những yếu tố quan trọng mà các nhà phát triển thường cân nhắc khi chọn mô hình AI cho ứng dụng của mình. Bên cạnh đó, còn có biến thể o4-mini-high, một phiên bản của o4-mini dành nhiều thời gian xử lý hơn để tăng độ tin cậy cho câu trả lời.

Năng lực mới vượt trội

Một bước tiến lớn của o3 và o4-mini so với các mô hình lý luận trước đây là khả năng sử dụng trực tiếp các công cụ có sẵn trong ChatGPT để tạo phản hồi. Chúng có thể tự động duyệt web để tìm thông tin mới nhất, thực thi mã Python thông qua tính năng Canvas, xử lý hình ảnh và thậm chí tạo ra hình ảnh mới.

Đặc biệt, o3 và o4-mini là những mô hình đầu tiên của OpenAI có khả năng "suy nghĩ bằng hình ảnh" (think with images). Người dùng có thể tải lên các hình ảnh như bản phác thảo trên bảng trắng hay sơ đồ từ file PDF, và các mô hình này sẽ phân tích chúng trong quá trình "suy nghĩ" của mình trước khi trả lời. Chúng có thể hiểu được cả những hình ảnh mờ, chất lượng thấp và thực hiện các thao tác như phóng to, xoay ảnh trong khi đang lý luận.

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 1. — Các mô hình mới của OpenAI có khả năng lập luận từ hình ảnh. Ảnh: OpenAI

Hiệu năng ấn tượng và giá cả cạnh tranh

Về hiệu năng, OpenAI cho biết o3 đạt kết quả hàng đầu (state-of-the-art) trong bài kiểm tra năng lực lập trình SWE-bench verified với điểm số 69.1%. Mô hình o4-mini cũng đạt hiệu năng tương tự với 68.1%, vượt xa đáng kể so với mô hình o3-mini trước đó (49.3%) và cả đối thủ Claude 3.7 Sonnet (62.3%).

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 2. — o3 và o4-mini có hiệu năng vượt trội so với các mô hình cũ của OpenAI. Ảnh: OpenAI

Bối cảnh cạnh tranh

Việc ra mắt o3 và o4-mini diễn ra trong bối cảnh cuộc đua AI toàn cầu ngày càng khốc liệt. Sau khi OpenAI tiên phong với mô hình lý luận o1, các đối thủ như Google, Meta, xAI, Anthropic, DeepSeek đã nhanh chóng tung ra các phiên bản cạnh tranh, thậm chí vượt trội hơn. Các mô hình lý luận đang dần trở thành xu thế chủ đạo. Đáng chú ý, CEO Sam Altman vào tháng 2 từng úp mở về việc tập trung nguồn lực cho một giải pháp phức tạp hơn thay vì phát hành o3 độc lập, nhưng áp lực cạnh tranh dường như đã khiến OpenAI thay đổi quyết định.

Hiện tại, người dùng các gói ChatGPT Pro, Plus và Team đã có thể trải nghiệm o3, o4-mini và o4-mini-high. Trong vài tuần tới, OpenAI dự kiến phát hành thêm o3-pro, phiên bản mạnh hơn của o3 dành riêng cho thuê bao ChatGPT Pro.

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google- Ảnh 3. — Người dùng gói Plus, Pro đã có thể trải nghiệm o3 và o4-mini trên ChatGPT

Sam Altman cũng đã úp mở rằng o3 và o4-mini có thể là những mô hình lý luận độc lập cuối cùng xuất hiện trên ChatGPT trước khi GPT-5 ra mắt. Mô hình thế hệ tiếp theo này được kỳ vọng sẽ hợp nhất khả năng của các mô hình truyền thống (như GPT-4.1) với các mô hình lý luận tiên tiến, tạo ra một bước nhảy vọt mới về năng lực AI.

Sự xuất hiện của o3 và o4-mini rõ ràng đã nâng cấp đáng kể khả năng suy luận, xử lý đa phương thức và tích hợp công cụ của ChatGPT, giúp OpenAI củng cố vị thế cạnh tranh và đồng thời hé lộ những bước đi tiếp theo hướng tới các mô hình AI toàn diện và mạnh mẽ hơn trong tương lai.

Theo The Verge

OpenAI ra mắt cặp AI "biết suy nghĩ": Hiểu ảnh, lập trình siêu đỉnh, đối đầu Google

Tóm tắt:

Tin xem nhiều

Mất 90% tài sản vì cúm gia cầm, người đàn ông miền Tây xây lại doanh nghiệp tiêu thụ 1 triệu quả trứng mỗi ngày

Đại án sở hữu kỳ nghỉ 3.300 tỷ đồng: Luật sư cảnh báo làn sóng điều tra có thể mở rộng trong ngành du lịch

Sau 17 năm làm viễn thông, Vietnamobile muốn tìm hướng tăng trưởng mới ở thị trường giải pháp số cho doanh nghiệp SME

Vị thế Apple lung lay trước khủng hoảng nguồn cung chip: Đầu hàng vì bão giá, thừa nhận tình hình hiện tại vượt quá sức chịu đựng

Thiên tài 25 tuổi sở hữu startup sắp được Elon Musk mua với giá 60 tỷ USD: Học song bằng toán và khoa học máy tính tại MIT, từng đánh bại Microsoft

Luật sư bảo vệ nạn nhân vụ lừa đảo sở hữu kỳ nghỉ: Điều khoản "bẫy" nguy hiểm nhất lại không nằm trong hợp đồng

Sự trở lại của Nokia: Kiếm hàng tỷ USD dù không còn bán điện thoại, rẽ lối sang một sứ mệnh hoàn toàn mới khiến cả thế giới trầm trồ

Điều gì khiến Gen Z chọn điều hòa Comfee trong mùa hè này?

Giá vàng lao dốc mạnh

Sáng 19-6, giá vàng miếng SJC, vàng nhẫn rớt 3,5 triệu đồng

Tóm tắt:

Các tin khác