Doanh nghiệp

Chuyện gì đây: Viettel và NVIDIA “bắt tay” đưa tiếng Việt vào phục vụ huấn luyện cho trợ lý AI

Chính phủ Việt Nam và NVIDIA vừa ký kết thành lập Trung tâm Nghiên cứu và Phát triển AI của NVIDIA và Trung tâm Dữ liệu AI của Viettel. Đáng chú ý, Viettel Solutions và NVIDIA đã công bố bộ dữ liệu tiếng Việt phục vụ huấn luyện cho trợ lý AI.

Việc hợp tác xây dựng bộ dữ liệu Tiếng Việt của hai tập đoàn nhằm cung cấp cho cộng đồng nghiên cứu một nguồn tài nguyên để phát triển các mô hình AI phù hợp với văn hóa và ngữ cảnh sử dụng Tiếng Việt.

Đại diện của Viettel Solutions, đơn vị trực tiếp tham gia vào thực hiện dự án cho biết, bộ dữ liệu này hiện đã được công bố trên trang chia sẻ công nghệ của NVIDIA và sẵn sàng cung cấp miễn phí cho cộng đồng nghiên cứu phát triển AI tại Việt Nam.

Chuyện gì đây: Viettel và NVIDIA “bắt tay” đưa tiếng Việt vào phục vụ huấn luyện cho trợ lý AI- Ảnh 1.

Về điểm khác biệt của bộ dữ liệu tiếng Việt này, nhóm kỹ sư tham gia vào nghiên cứu của Viettel Solutions tiết lộ, bộ dữ liệu Tiếng Việt do Viettel và NVIDA hợp tác nghiên cứu đã được xử lý và lọc qua NeMo Curator, giúp giảm kích thước bộ dữ liệu mà không làm giảm chất lượng. Đây cũng là bộ dữ liệu Việt Nam chất lượng cao đầu tiên được công bố tới cộng đồng nghiên cứu và phát triển trí tuệ nhân tạo Việt Nam.

Dựa trên sự hỗ trợ từ nền tảng NeMo Framework và hạ tầng tính toán GPU với nguồn tài nguyên lớn của NVIDIA, các kỹ sư của Viettel thu thập và xử lý dữ liệu từ nhiều nguồn khác nhau, thực hiện các bước chuẩn hóa, phân loại và làm sạch dữ liệu. Bộ dữ liệu này được xử lý một cách nhanh chóng và hiệu quả, giảm thiểu thời gian huấn luyện mô hình AI mà vẫn đảm bảo chất lượng.

Các kỹ thuật tối ưu hóa như loại bỏ dữ liệu trùng lặp, sử dụng GPU để xử lý song song, và áp dụng các công cụ như NeMo Curator đã giúp rút ngắn thời gian huấn luyện mô hình từ 80 ngày xuống còn 20 ngày, nhanh hơn gấp 4 lần so với trước đây.

Viettel Solutions cũng cho biết, bộ dữ liệu tiếng Việt chỉ là bước khởi đầu trong hành trình hợp tác dài hạn giữa Viettel Solutions và NVIDIA. Hai bên cam kết sẽ tiếp tục mở rộng hợp tác, phát triển các bộ dữ liệu phong phú hơn về chủ đề, nâng cao độ chính xác và sự đa dạng của các mẫu dữ liệu, đồng thời nghiên cứu các lĩnh vực ứng dụng AI chuyên sâu như y tế, giáo dục, thương mại và hành chính công.

Một trong những mục tiêu tiếp theo của dự án là ứng dụng công nghệ song song hóa và tối ưu phần cứng mới nhất của NVIDIA để xử lý các bộ dữ liệu rất lớn, nhằm giảm chi phí phần cứng và tiêu thụ điện năng. Điều này sẽ giúp các nghiên cứu và phát triển AI tiếp tục phát triển mạnh mẽ tại Việt Nam.

Kết quả hợp tác đầu tiên giữa Viettel Solutions và NVIDIA về lĩnh vực dữ liệu đã mở ra những cơ hội mới cho cộng đồng nghiên cứu và phát triển AI trong nước. Đồng thời, bộ dữ liệu Tiếng Việt chất lượng cao và quy mô lớn này sẽ mở ra cơ hội sáng tạo các sản phẩm AI tiên tiến, mang tính bản địa hóa cao cho các nhà phát triển và nghiên cứu viên tại Việt Nam, góp phần thúc đẩy quá trình chuyển đổi số, nâng cao năng lực nghiên cứu và phát triển AI trong nước.

Các tin khác

Đằng sau Trung tâm Dữ liệu 35.000 tỷ tại Bà Rịa - Vũng Tàu

Đằng sau Trung tâm Dữ liệu 35.000 tỷ tại Bà Rịa - Vũng Tàu

Trung tâm Dữ liệu Digital Hub được xây dựng trên diện tích 100ha, gồm 5 tòa nhà trung tâm dữ liệu (Data Center Hall), tổng công suất mỗi Data Center Hall là 20MW, tổng công suất toàn bộ 5 DC Hall lên đến 6.000 tủ chứa thiết bị (racks) với công suất bình quân 15kW/rack.
Dệt may Hòa Thọ ước lãi kỷ lục

Dệt may Hòa Thọ ước lãi kỷ lục

Công ty dệt may này dự kiến doanh thu ước 4.950 tỷ đồng, vượt 10% kế hoạch năm. Lợi nhuận ước đạt 336 tỷ đồng, gấp đôi năm trước và vượt 53% so với kế hoạch năm.
VinIF tài trợ 900 tỷ đồng phát triển khoa học công nghệ

VinIF tài trợ 900 tỷ đồng phát triển khoa học công nghệ

Ngày 20/12/2024, tại Hà Nội, Quỹ Đổi mới Sáng tạo Vingroup (VinIF) tổ chức Lễ công bố các chương trình tài trợ năm 2024, theo đó tổng mức tài trợ trong 6 năm liên tiếp của VinIF cho khoa học công nghệ Việt là hơn 900 tỷ đồng. Quỹ VinIF là chương trình phi lợi nhuận của Tập đoàn Vingroup, nhằm mục tiêu thay đổi môi trường nghiên cứu và góp phần tạo bệ phóng đưa khoa học Việt vươn tầm quốc tế.
Classic Fine Foods mang đến nền tảng vững chắc, công thức thành công

Classic Fine Foods mang đến nền tảng vững chắc, công thức thành công

Trong thị trường ẩm thực cạnh tranh ngày càng khốc liệt, việc tạo ra sự khác biệt trong món ăn không chỉ đến từ kỹ năng nấu nướng của đầu bếp mà còn phụ thuộc vào chất lượng nguyên liệu và giải pháp sáng tạo. Classic Fine Foods với sứ mệnh nâng tầm ẩm thực, chính là đối tác lý tưởng giúp bạn hiện thực hóa điều này.
Cơ hội hợp tác cùng các doanh nghiệp Ý tại triển lãm quốc phòng quốc tế Việt Nam 2024

Cơ hội hợp tác cùng các doanh nghiệp Ý tại triển lãm quốc phòng quốc tế Việt Nam 2024

Sáng 19/12, Triển lãm Quốc phòng quốc tế Việt Nam 2024 đã chính thức khai mạc tại Sân bay Gia Lâm, TP. Hà Nội. Tham gia chương trình, gian hàng của Thương vụ Ý tại Việt Nam thu hút đông đảo khách tham quan với sự hiện diện của 10 doanh nghiệp hàng đầu giới thiệu các công nghệ tiên tiến trong lĩnh vực quốc phòng, quân sự và an ninh.
Lợi nhuận năm 2025 của Đầu tư Hạ tầng Giao thông Đèo Cả (HHV) được dự báo cao kỷ lục

Lợi nhuận năm 2025 của Đầu tư Hạ tầng Giao thông Đèo Cả (HHV) được dự báo cao kỷ lục

Chứng khoán DSC dự báo kết quả kinh doanh năm 2025 của Công ty Cổ phần Đầu tư Hạ tầng Giao thông Đèo Cả (mã: HHV) với doanh thu dự phóng đạt 3.790 tỷ và lợi nhuận sau thuế dự phóng đạt 553 tỷ. Đây sẽ là mức doanh thu và lợi nhuận cao kỷ lục nếu doanh nghiệp có thể thực hiện được.
Automation để làm gì? Quá đơn giản! Để xử lý 1000+ cuộc gọi/ngày, tăng hơn 4.000 học viên/năm

Automation để làm gì? Quá đơn giản! Để xử lý 1000+ cuộc gọi/ngày, tăng hơn 4.000 học viên/năm

Giữa tình hình thị trường biến động, nguồn lực hạn chế thì chuyển đổi số lại giúp một số doanh nghiệp làm nên điều không tưởng. Trong hơn 7 năm làm chuyển đổi số, không khó để Bizfly ghi nhận những cú lộn ngược dòng, thậm chí doanh thu còn về nhiều hơn trước thời kỳ khó khăn.