Công nghệ

Trung Quốc bất ngờ qua mặt Mỹ tại cuộc thi dịch thuật AI toàn cầu

Theo kết quả sơ bộ từ ban tổ chức, Hunyuan-MT-7B đứng đầu ở 30 trên tổng số 31 bài kiểm tra, vượt qua cả những hệ thống nổi tiếng của Google và OpenAI.

WMT25 là sự kiện thường niên quy tụ các nhà nghiên cứu và phát triển dịch máy trên toàn cầu, được xem như “sân chơi đỉnh cao” để đánh giá năng lực công nghệ dịch thuật.

ybe1aint.png
Website của mô hình Hunyuan. Ảnh: Shutterstock

Điều khiến giới công nghệ chú ý là quy mô “nhỏ nhưng có võ”, chỉ có 7 tỷ pham số của Hunyuan-MT-7B.

Thay vì chạy theo xu hướng phóng to số lượng tham số, Tencent lại tập trung vào việc xây dựng một “quy trình huấn luyện toàn diện”, bao gồm chọn lọc dữ liệu, huấn luyện liên tục, tinh chỉnh nhiều lớp và học tăng cường.

Nhờ vậy, mô hình này vẫn tạo ra kết quả mượt mà, chính xác và thậm chí vượt trội hơn những đối thủ có quy mô lớn gấp nhiều lần.

"Điểm mạnh của Hunyuan-MT-7B chính là tận dụng ít tham số để đạt chất lượng ngang bằng, thậm chí tốt hơn các mô hình khổng lồ”, nhóm phát triển chia sẻ.

Các ngôn ngữ được đưa vào thử nghiệm rất đa dạng, từ Ả Rập, Estonia cho đến Maasai - thứ tiếng của khoảng 1,5 triệu người ở Kenya và Tanzania.

Ngoài ra còn có cặp ngôn ngữ Czech - Ukrainian, tiếng Nhật - Trung giản thể. Chỉ duy nhất với tiếng Bhojpuri – ngôn ngữ được hơn 50 triệu người tại Ấn Độ và Nepal sử dụng, Hunyuan-MT-7B không đạt vị trí cao nhất.

Tuy nhiên, ban tổ chức cũng nhấn mạnh đây mới chỉ là kết quả sơ bộ, dựa trên đánh giá tự động.

“Những con số này cần được nhìn nhận một cách thận trọng, vì có thể vẫn tồn tại thiên lệch trong quá trình chấm điểm”, ông Tom Kocmi, nhà nghiên cứu của công ty Cohere và đồng thời là trưởng ban tổ chức WMT25, cho biết.

Kết quả chính thức dựa trên đánh giá thủ công từ con người sẽ được công bố tại hội nghị diễn ra từ ngày 5 đến 9/11 tại thành phố Tô Châu (Trung Quốc).

Không chỉ dừng lại ở phòng thí nghiệm, Tencent đã đưa mô hình này vào các sản phẩm thực tế như nền tảng họp trực tuyến Tencent Meeting, trình duyệt web và bản doanh nghiệp của ứng dụng WeChat.

Đồng thời, Hunyuan-MT-7B cũng đã được chia sẻ trên Hugging Face và GitHub để cộng đồng phát triển AI có thể khai thác.

Sự kiện này một lần nữa cho thấy cuộc đua dịch máy bằng AI đang nóng lên từng ngày và “ngựa ô” Hunyuan-MT-7B của Tencent đã chứng minh rằng không phải mô hình lớn mới là kẻ mạnh.

(Theo aitechsuite)

Các tin khác

Giải mã công nghệ "đuổi mây"

Giải mã công nghệ "đuổi mây"

Công nghệ điều khiển thời tiết đang ngày càng tiên tiến và đáng tin cậy hơn qua từng năm, được áp dụng để phục vụ đời sống, trong đó có công nghệ 'đuổi mây".
Mặt trái phía sau các ứng dụng miễn phí: Người dùng không hề biết mình trả giá đắt thế nào!

Mặt trái phía sau các ứng dụng miễn phí: Người dùng không hề biết mình trả giá đắt thế nào!

Nhiều người tin rằng các ứng dụng miễn phí trên điện thoại hoặc máy tính là một "món hời" vì chúng không yêu cầu trả phí. Thực tế, nhiều ứng dụng miễn phí kiếm tiền bằng cách thu thập và bán dữ liệu người dùng hoặc chứa quảng cáo độc hại, gây ra các rủi ro nghiêm trọng về quyền riêng tư và bảo mật.
Google Maps sắp triển khai tính năng mới

Google Maps sắp triển khai tính năng mới

Bạn đã bao giờ thấy phiền toái khi phải liên tục mở khóa điện thoại chỉ để xem lộ trình trên Google Maps, sự bất tiện này sắp được cải thiện với một tính năng sắp ra mắt trên Android 16.
Răng cá mập đang bị ăn mòn

Răng cá mập đang bị ăn mòn

Răng cá mập – vũ khí săn mồi sắc bén của chúng – đang bị ăn mòn do độ axit trong nước biển tăng cao.