Công nghệ

Google đáp trả nhanh ChatGPT Translate bằng TranslateGemma

Google cho biết đây là "một bước tiến đáng kể trong lĩnh vực dịch thuật mở". Bộ mô hình này có khả năng xử lý tới 55 ngôn ngữ, bao gồm các ngôn ngữ phổ biến như tiếng Tây Ban Nha, Pháp, Trung Quốc và Hindi.

Google đáp trả nhanh ChatGPT Translate bằng TranslateGemma - Ảnh 1.

Bộ mô hình TranslateGemma cho thấy hướng đi mới của Google trong dịch thuật AI

ẢNH: GOOGLE

Thông báo về TranslateGemma được đưa ra chỉ vài giờ sau khi OpenAI phát hành ChatGPT Translate - một công cụ tập trung vào việc dịch thuật với giọng điệu và ngữ cảnh chính xác, thay vì chỉ dịch từng từ. ChatGPT Translate có giao diện hai bảng, với tính năng tự động nhận diện ngôn ngữ ở bên trái và ngôn ngữ đích ở bên phải, tương tự như Google Translate.

Google mang dịch thuật mở lên tầm mới

TranslateGemma có sẵn với các mô hình 4B, 12B và 27B. Theo Google, mô hình 12B cho hiệu suất tốt hơn so với mô hình Gemma 3 27B cơ bản khi đo trên chuẩn WMT24++, có nghĩa các nhà phát triển có thể đạt được hiệu suất cao hơn với tham số ít hơn một nửa, giúp tăng thông lượng và giảm độ trễ mà không làm giảm độ chính xác.

Mô hình 4B được tối ưu hóa cho suy luận trên thiết bị di động, trong khi mô hình 12B phù hợp với máy tính xách tay của người tiêu dùng. Mô hình 27B lớn hơn yêu cầu sức mạnh tính toán cao hơn, chẳng hạn như một card đồ họa NVIDIA H100 trên đám mây. Các thử nghiệm trên chuẩn dịch hình ảnh Vistra cho thấy TranslateGemma có khả năng dịch văn bản trong hình ảnh tốt hơn, mặc dù không được tinh chỉnh đặc biệt cho mục đích này.

Google cho biết họ đã đạt được hiệu suất nói trên thông qua một quy trình hai giai đoạn. Giai đoạn đầu tiên là Tinh chỉnh có giám sát (Supervised Fine-Tuning), trong đó các mô hình Gemma 3 được huấn luyện trên sự kết hợp giữa văn bản do con người dịch và dữ liệu tổng hợp chất lượng cao. Giai đoạn thứ hai là Học tăng cường (Reinforcement Learning), sử dụng một nhóm các mô hình khen thưởng để hướng dẫn các mô hình đến các bản dịch tự nhiên và chính xác hơn về ngữ cảnh.

Các mô hình TranslateGemma hiện đã có sẵn để tải xuống trên Kaggle và Hugging Face, từ đó mở ra cơ hội cho bất kỳ ai muốn thử nghiệm hoặc phát triển dựa trên chúng.

Các tin khác

Eco Retreat ra mắt phân khu lễ hội 71 ha

Dự án Eco Retreat 220 ha ra mắt phân khu mới với tên gọi "Mùa Lễ Hội", tập trung các hoạt động thương mại, dịch vụ, sự kiện cộng đồng.

Hà Nội sẽ có khu công viên công nghệ số gần 200ha

Khu Công viên Công nghệ số và Hỗn hợp tại hai phường Tây Tựu và Phú Diễn nhằm tạo dựng môi trường cho các doanh nghiệp nghiên cứu, sản xuất công nghệ tiên tiến, đồng thời thu hút chuyên gia quốc tế và phát triển hệ sinh thái khởi nghiệp.