Công nghệ

Việt Nam đã có mô hình AI do người Việt làm chủ và kiểm soát huấn luyện

Sự quan tâm của thế giới đối với AI đang ngày một gia tăng với những chú ý tập trung nhiều nhất vào các quốc gia sở hữu nhiều mô hình AI hàng đầu thế giới như Mỹ và Trung Quốc. Là một trong những khu vực kinh tế quan trọng của thế giới, Đông Nam Á đang dần trở thành điểm nóng mới về AI với các bước tiến lớn có thể khiến các nhà hoạch định chính sách, nhà đầu tư và chuyên gia công nghệ toàn cầu quan tâm.

Việt Nam đã có mô hình AI do người Việt làm chủ và kiểm soát huấn luyện- Ảnh 1.

Việt Nam đã có mô hình AI nội địa, là 1 trong số ít các mô hình AI phát triển từ đầu tại khu vực Đông Nam Á hiện nay

Tại Việt Nam, Đảng và Chính phủ cũng đang quyết tâm trong việc định hình và thúc đẩy kỷ nguyên phát triển công nghệ của đất nước, thể hiện thông qua Nghị quyết 57-NQ/TW về Đột phá phát triển Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Định hướng này đã tạo động lực mạnh mẽ cho các doanh nghiệp công nghệ trong nước đầu tư và khai thác tiềm năng của công nghệ tiên tiến toàn cầu.

Hiện tại, Việt Nam đã trở thành một trong số ít các quốc gia tại khu vực Đông Nam Á sở hữu mô hình ngôn ngữ lớn (LLM) nội địa. Cụ thể, từ năm 2023, Zalo đã huấn luyện thành công và cho ra mắt mô hình LLM tập trung vào tiếng Việt, được nghiên cứu và phát triển hoàn toàn bởi đội ngũ kỹ sư người Việt.

Chọn huấn luyện từ đầu và kết quả bất ngờ

Hiện có 2 kỹ thuật huấn luyện LLM bao gồm kỹ thuật tinh chỉnh (fine-tuned model) - tối ưu các LLM đã được huấn luyện trước đó để tạo ra LLM mới phục vụ mục đích chuyên biệt và kỹ thuật huấn luyện từ đầu (from-scratch model) - triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định.

Việc tinh chỉnh được nhiều doanh nghiệp lựa chọn bởi dễ triển khai, tiết kiệm tài nguyên, có thể cho hiệu quả tốt hơn và phù hợp với bối cảnh hạn chế về thiết bị huấn luyện, dữ liệu.

Tuy vậy, Zalo vẫn lựa chọn kỹ thuật huấn luyện từ đầu nhằm giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình,. Năm 2024, mô hình với 13 tỉ tham số của Zalo chính thức vượt qua các tên tuổi lớn của thế giới để xếp thứ 2 trên bảng xếp hạng các mô hình LLM tiếng Việt huấn luyện từ đầu của nền tảng VMLU.

Nỗ lực phát triển mô hình AI của người Việt

Có 3 vấn đề cốt lõi khi huấn luyện LLM là thiết bị huấn luyện, dữ liệu và trình độ kỹ thuật thì trước đây, Việt Nam đã gặp trở ngại ở cả 3.

Đội ngũ Zalo khi ấy đã phải nghiên cứu và thực nghiệm trên các GPU dân dụng nhỏ để tranh thủ trang bị kiến thức và năng lực huấn luyện LLM, sẵn sàng ngay khi có hạ tầng tính toán lớn. Các chip huấn luyện về AI khan hiếm nên dù đã đặt mua 8 máy chủ DGX H100 của Nvidia thì Zalo cũng không thể sở hữu cùng lúc các thiết bị mà phải chờ từng đợt bàn giao từ nhà sản xuất. Do vậy, việc tối ưu cho hạ tầng tính toán chưa hoàn thiện để tranh thủ thời gian huấn luyện là cũng là một bài toán mà đội ngũ Zalo phải giải quyết.

Đồng thời, dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt.

Việt Nam đã có mô hình AI do người Việt làm chủ và kiểm soát huấn luyện- Ảnh 2.

"Mặc dù xuất phát điểm gặp nhiều khó khăn so với các công ty lớn trên thế giới nhưng Zalo vẫn quyết định nhập cuộc chơi từ sớm với mục tiêu phát triển thành công mô hình AI của riêng Việt Nam. Chúng tôi đã tham vấn kinh nghiệm từ các nhà nghiên cứu, kỹ sư tại nhiều viện nghiên cứu hàng đầu trên thế giới để có chiến lược phát triển phù hợp. Những dấu mốc thành công tới hiện tại là động lực để các kỹ sư Zalo tiếp tục tối ưu mô hình lớn hơn về lượng và tốt hơn về chất. Đồng thời khai thác tính ứng dụng để tạo ra nhiều sản phẩm AI đẳng cấp thế giới cho người dùng Việt", TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI.

Việt Nam đã có mô hình AI do người Việt làm chủ và kiểm soát huấn luyện- Ảnh 3.

Máy chủ DGX H100 Zalo đặt mua của Nvidia

Hiện mô hình AI của Zalo không chỉ thành công trên khía cạnh nghiên cứu huấn luyện mà còn đang được đưa vào ứng dụng, thúc đẩy việc tiếp cận và khai thác giá trị từ công nghệ mới tiên tiến cho người Việt.

Đầu năm 2025, Zalo ra mắt Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên nền tảng nhắn tin Zalo. Trợ lý hỗ trợ hỏi đáp các chủ đề khác nhau trong cuộc sống, sáng tạo nội dung và giải trí. Theo thống kê của Zalo, trợ lý Kiki Info đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong chưa đầy 2 tháng.

Việt Nam đã có mô hình AI do người Việt làm chủ và kiểm soát huấn luyện- Ảnh 4.

Mô hình LLM của Zalo được ứng dụng để phát triển Trợ lý Kiki Info

Một ứng dụng khác của mô hình LLM của Zalo là thiệp AI cũng chạm mốc 15 triệu thiệp được khởi tạo và gửi đi chỉ trong 2 tháng. Đây là ứng dụng được đông đảo người dùng Zalo quan tâm để gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.

Hiện các ứng dụng từ mô hình ngôn ngữ lớn vẫn đang tiếp tục được Zalo mở rộng phát triển, hứa hẹn mang lại nhiều giá trị hữu ích cho người dùng trong nước.

Các tin khác

Phát triển thủy sản Việt Nam: Bắt đầu từ minh bạch và chuyển đổi xanh

Trong bối cảnh ngành thủy sản Việt Nam đang chịu sức ép chưa từng có từ biến đổi khí hậu, thẻ vàng IUU, rào cản kỹ thuật và “rào cản xanh” từ thị trường xuất khẩu, yêu cầu chuyển đổi sang phát triển bền vững, phát triển xanh, minh bạch và ứng dụng công nghệ cao trở nên cấp thiết hơn bao giờ hết.

Diễn biến mưa dông ở miền Bắc

Hôm nay (17/6), miền Bắc ít mưa, trời nắng, từ chiều tối và đêm nay có mưa rào và dông rải rác, cục bộ có mưa to. Trong mưa dông có khả năng xảy ra lốc sét, mưa đá và gió giật mạnh. Tây Nguyên, Nam Bộ chiều nay cũng có mưa rải rác, cục bộ mưa to. Miền Trung tiếp tục nắng nóng gay gắt.

PVCFC tổ chức đại hội cổ đông thường niên năm 2025, chia cổ tức 20%

Tại Cà Mau, ngày 16.5.2025, Công ty CP Phân bón Dầu khí Cà Mau (PVCFC, mã chứng khoán: DCM) đã tổ chức Đại hội đồng cổ đông (ĐHĐCĐ) thường niên năm 2025 tại trụ sở chính của công ty (TP.Cà Mau) kết hợp hình thức trực tiếp và trực tuyến, đồng thời áp dụng bỏ phiếu điện tử để tăng tính minh bạch và thuận lợi cho cổ đông ở xa. ĐHĐCĐ cũng đã thông qua phương án chia cổ tức năm 2024 bằng tiền mặt với tỷ lệ 20%, giữ nguyên so với năm 2023.

Đòn bẩy hạ tầng gia tăng giá trị cho khu dân cư Sei Harmony

Toạ lạc tại vị trí đắc địa, Sei Harmony khẳng định vị thế của một khu dân cư kiểu mẫu mới tại quận Bình Tân nói riêng và khu Tây Sài Gòn nói chung với quy hoạch đầu tư xây dựng bài bản mang đậm phong cách Nhật Bản.

Đà Nẵng: Bé 13 tuổi đột quỵ khi đang tập văn nghệ

Ngày 16/6, Bệnh viện Đà Nẵng cho hay vừa phẫu thuật thành công, cứu sống một bệnh nhi 13 tuổi bị xuất huyết não nghiêm trọng do vỡ dị dạng mạch máu não - một trong những nguyên nhân đột quỵ thường bị bỏ sót ở trẻ em.