Công nghệ

Trung Quốc bất ngờ qua mặt Mỹ tại cuộc thi dịch thuật AI toàn cầu

Theo kết quả sơ bộ từ ban tổ chức, Hunyuan-MT-7B đứng đầu ở 30 trên tổng số 31 bài kiểm tra, vượt qua cả những hệ thống nổi tiếng của Google và OpenAI.

WMT25 là sự kiện thường niên quy tụ các nhà nghiên cứu và phát triển dịch máy trên toàn cầu, được xem như “sân chơi đỉnh cao” để đánh giá năng lực công nghệ dịch thuật.

ybe1aint.png
Website của mô hình Hunyuan. Ảnh: Shutterstock

Điều khiến giới công nghệ chú ý là quy mô “nhỏ nhưng có võ”, chỉ có 7 tỷ pham số của Hunyuan-MT-7B.

Thay vì chạy theo xu hướng phóng to số lượng tham số, Tencent lại tập trung vào việc xây dựng một “quy trình huấn luyện toàn diện”, bao gồm chọn lọc dữ liệu, huấn luyện liên tục, tinh chỉnh nhiều lớp và học tăng cường.

Nhờ vậy, mô hình này vẫn tạo ra kết quả mượt mà, chính xác và thậm chí vượt trội hơn những đối thủ có quy mô lớn gấp nhiều lần.

"Điểm mạnh của Hunyuan-MT-7B chính là tận dụng ít tham số để đạt chất lượng ngang bằng, thậm chí tốt hơn các mô hình khổng lồ”, nhóm phát triển chia sẻ.

Các ngôn ngữ được đưa vào thử nghiệm rất đa dạng, từ Ả Rập, Estonia cho đến Maasai - thứ tiếng của khoảng 1,5 triệu người ở Kenya và Tanzania.

Ngoài ra còn có cặp ngôn ngữ Czech - Ukrainian, tiếng Nhật - Trung giản thể. Chỉ duy nhất với tiếng Bhojpuri – ngôn ngữ được hơn 50 triệu người tại Ấn Độ và Nepal sử dụng, Hunyuan-MT-7B không đạt vị trí cao nhất.

Tuy nhiên, ban tổ chức cũng nhấn mạnh đây mới chỉ là kết quả sơ bộ, dựa trên đánh giá tự động.

“Những con số này cần được nhìn nhận một cách thận trọng, vì có thể vẫn tồn tại thiên lệch trong quá trình chấm điểm”, ông Tom Kocmi, nhà nghiên cứu của công ty Cohere và đồng thời là trưởng ban tổ chức WMT25, cho biết.

Kết quả chính thức dựa trên đánh giá thủ công từ con người sẽ được công bố tại hội nghị diễn ra từ ngày 5 đến 9/11 tại thành phố Tô Châu (Trung Quốc).

Không chỉ dừng lại ở phòng thí nghiệm, Tencent đã đưa mô hình này vào các sản phẩm thực tế như nền tảng họp trực tuyến Tencent Meeting, trình duyệt web và bản doanh nghiệp của ứng dụng WeChat.

Đồng thời, Hunyuan-MT-7B cũng đã được chia sẻ trên Hugging Face và GitHub để cộng đồng phát triển AI có thể khai thác.

Sự kiện này một lần nữa cho thấy cuộc đua dịch máy bằng AI đang nóng lên từng ngày và “ngựa ô” Hunyuan-MT-7B của Tencent đã chứng minh rằng không phải mô hình lớn mới là kẻ mạnh.

(Theo aitechsuite)

Các tin khác

Hay nói đạo lý, nhưng sống ích kỷ: 6 dấu hiệu nhận diện kẻ đạo đức giả

Người ta vẫn ví kẻ đạo đức giả như một loại “độc tố xã hội”: càng tiếp xúc lâu, năng lượng và chất lượng cuộc sống của bạn càng bị bào mòn. Họ có thể khoác lên mình lớp vỏ của sự tử tế, tỏ ra chuẩn mực, cao thượng, nhưng hành vi thực chất lại đi ngược hoàn toàn với những điều họ rao giảng.

Dấu chân 2 "đoàn quân" hồi hương xây dựng kinh tế Việt Nam: Người từ Đông Âu dựng "móng và cột", người từ Bắc Mỹ xây "mái và nội thất số"

Vợ chồng ông Phạm Nhật Vượng, bà Nguyễn Thị Phương Thảo, ông Hồ Hùng Anh, Nguyễn Đăng Quang... vẫn được gọi là các "soái ca" Đông Âu, trở về Việt Nam mang theo nguồn vốn dồi dào và tư duy vận hành công nghiệp, tập trung vào các lĩnh vực xương sống của nền kinh tế.

Vàng trắng là gì?

Vàng trắng là loại vàng được pha trộn từ vàng nguyên chất và các kim loại trắng như palladium, niken, bạc hoặc platin khiến vàng trắng vừa giữ được giá trị của vàng, vừa có màu sáng trắng gần giống bạch kim.

TP HCM vượt khó khi dạy học 2 buổi/ngày

Quy định về dạy 2 buổi/ngày ở các cơ sở giáo dục được xem là căn cứ pháp lý cụ thể, rõ ràng để các nhà trường triển khai giáo dục toàn diện