Khoa học

Google trình làng "át chủ bài" mới cho Gemini AI, giá "mềm" nhưng mạnh mẽ bất ngờ

Tóm tắt:
  • Google ra mắt Gemini 2.5 Flash, mô hình AI hybrid mới với khả năng suy luận linh hoạt.
  • Phiên bản preview cung cấp tùy chọn bật/tắt suy luận để tối ưu phản hồi và chi phí.
  • Gemini 2.5 Flash thể hiện hiệu năng vượt trội so với phiên bản 2.0, cạnh tranh cao với đối thủ.
  • Giá thành cạnh tranh, chỉ 0,15 USD mỗi 1 triệu token đầu vào, thấp hơn nhiều mô hình cạnh tranh.
  • Ra mắt nhằm nâng cao sức mạnh, tính linh hoạt và hiệu quả về chi phí trong thị trường AI sôi động.

Google vừa chính thức tung ra bản preview của mô hình Gemini 2.5 Flash, một động thái được xem là bước tiến quan trọng trong cuộc đua AI. Được công bố lần đầu tại sự kiện Cloud Next tuần trước, phiên bản mới này không chỉ cải thiện đáng kể về hiệu năng mà còn mang đến một khái niệm độc đáo: mô hình suy luận lai (hybrid) đầu tiên của Google.

Google ngày càng nâng tầm sức mạnh của Gemini AI.

Google ngày càng nâng tầm sức mạnh của Gemini AI.

Hiện tại, các nhà phát triển và người dùng đã có thể trải nghiệm Gemini 2.5 Flash preview thông qua Gemini API (trên Google AI Studio và Vertex AI), cũng như qua bộ chọn mô hình trong các ứng dụng Gemini và tích hợp với Canvas để tinh chỉnh tài liệu, mã nguồn.

Điểm nhấn đặc biệt của Gemini 2.5 Flash là khả năng "lai" độc đáo. Đây là mô hình đầu tiên của Google cho phép các nhà phát triển có thể chủ động bật hoặc tắt hoàn toàn khả năng "suy luận" (reasoning) của AI. Theo Google, sự linh hoạt này giúp tối ưu hóa phản hồi dựa trên các yếu tố mong muốn như chất lượng đầu ra, chi phí vận hành và độ trễ. Nếu tắt suy luận, Gemini 2.5 Flash có thể hoạt động như một bản nâng cấp trực tiếp, thay thế cho Gemini 2.0 Flash trước đó.

Google tự tin khẳng định Gemini 2.5 Flash đạt tỷ lệ hiệu năng trên chi phí (performance-to-cost) xuất sắc. Mức giá công ty đưa ra cho bản preview cũng rất cạnh tranh:

- 0,15 USD cho mỗi 1 triệu token đầu vào.

- 0,60 USD cho mỗi 1 triệu token đầu ra (khi tắt suy luận).

- 3,50 USD cho mỗi 1 triệu token đầu ra (khi bật suy luận).

Mức giá này, đặc biệt là khi bật suy luận, thấp hơn đáng kể so với nhiều mô hình đối thủ. Dù chỉ là bản xem trước, Logan Kilpatrick từ Google cho biết model này đã "cho thấy những bước tiến vượt bậc so với 2.0 Flash".

Dựa trên các bảng điểm benchmark được công bố, Gemini 2.5 Flash thể hiện sự cải thiện rõ rệt so với phiên bản 2.0 và tỏ ra rất cạnh tranh so với các mô hình tiên phong khác như Claude Sonnet 3.7 của Anthropic hay Grok 3 Beta. Mặc dù mô hình o4-mini mới ra mắt của OpenAI có thể nhỉnh hơn ở một số bài kiểm tra hiệu năng, nhưng đi kèm với đó là mức chi phí cao hơn đáng kể so với Gemini 2.5 Flash.

Sức mạnh điểm hiệu suất của Gemini 2.5 Flash so với các mô hình khác.

Sức mạnh điểm hiệu suất của Gemini 2.5 Flash so với các mô hình khác.

Sự ra mắt của Gemini 2.5 Flash preview đánh dấu nỗ lực của Google trong việc cung cấp các giải pháp AI mạnh mẽ, linh hoạt và hiệu quả về chi phí, hứa hẹn mang đến nhiều lựa chọn hơn cho các nhà phát triển và người dùng trong bối cảnh thị trường AI đang ngày càng sôi động.

XEM THÊM CÁC KỲ
1 2 3 4 5229Kỳ mới nhất

Các tin khác

Giá vàng đồng loạt giảm mạnh

Sáng nay (20/4), cả vàng SJC và vàng nhẫn đều giảm mạnh, bằng giá nhau ở mốc 114 triệu đồng/lượng. Hiện, giá vàng, trong nước vẫn cao hơn thế giới hơn 9 triệu đồng/lượng.