Sự quan tâm của thế giới đối với AI đang ngày một gia tăng với những chú ý tập trung nhiều nhất vào các quốc gia sở hữu nhiều mô hình AI hàng đầu thế giới như Mỹ và Trung Quốc. Là một trong những khu vực kinh tế quan trọng của thế giới, Đông Nam Á đang dần trở thành điểm nóng mới về AI với các bước tiến lớn có thể khiến các nhà hoạch định chính sách, nhà đầu tư và chuyên gia công nghệ toàn cầu quan tâm.

Việt Nam đã có mô hình AI nội địa, là 1 trong số ít các mô hình AI phát triển từ đầu tại khu vực Đông Nam Á hiện nay
Tại Việt Nam, Đảng và Chính phủ cũng đang quyết tâm trong việc định hình và thúc đẩy kỷ nguyên phát triển công nghệ của đất nước, thể hiện thông qua Nghị quyết 57-NQ/TW về Đột phá phát triển Khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Định hướng này đã tạo động lực mạnh mẽ cho các doanh nghiệp công nghệ trong nước đầu tư và khai thác tiềm năng của công nghệ tiên tiến toàn cầu.
Hiện tại, Việt Nam đã trở thành một trong số ít các quốc gia tại khu vực Đông Nam Á sở hữu mô hình ngôn ngữ lớn (LLM) nội địa. Cụ thể, từ năm 2023, Zalo đã huấn luyện thành công và cho ra mắt mô hình LLM tập trung vào tiếng Việt, được nghiên cứu và phát triển hoàn toàn bởi đội ngũ kỹ sư người Việt.
Chọn huấn luyện từ đầu và kết quả bất ngờ
Hiện có 2 kỹ thuật huấn luyện LLM bao gồm kỹ thuật tinh chỉnh (fine-tuned model) - tối ưu các LLM đã được huấn luyện trước đó để tạo ra LLM mới phục vụ mục đích chuyên biệt và kỹ thuật huấn luyện từ đầu (from-scratch model) - triển khai tất cả quy trình từ khởi tạo tham số, quyết định kiến trúc mô hình tới thuật toán huấn luyện trên tập dữ liệu nhất định.
Việc tinh chỉnh được nhiều doanh nghiệp lựa chọn bởi dễ triển khai, tiết kiệm tài nguyên, có thể cho hiệu quả tốt hơn và phù hợp với bối cảnh hạn chế về thiết bị huấn luyện, dữ liệu.
Tuy vậy, Zalo vẫn lựa chọn kỹ thuật huấn luyện từ đầu nhằm giúp người Việt làm chủ và kiểm soát hoàn toàn quá trình huấn luyện cũng như mô hình,. Năm 2024, mô hình với 13 tỉ tham số của Zalo chính thức vượt qua các tên tuổi lớn của thế giới để xếp thứ 2 trên bảng xếp hạng các mô hình LLM tiếng Việt huấn luyện từ đầu của nền tảng VMLU.
Nỗ lực phát triển mô hình AI của người Việt
Có 3 vấn đề cốt lõi khi huấn luyện LLM là thiết bị huấn luyện, dữ liệu và trình độ kỹ thuật thì trước đây, Việt Nam đã gặp trở ngại ở cả 3.
Đội ngũ Zalo khi ấy đã phải nghiên cứu và thực nghiệm trên các GPU dân dụng nhỏ để tranh thủ trang bị kiến thức và năng lực huấn luyện LLM, sẵn sàng ngay khi có hạ tầng tính toán lớn. Các chip huấn luyện về AI khan hiếm nên dù đã đặt mua 8 máy chủ DGX H100 của Nvidia thì Zalo cũng không thể sở hữu cùng lúc các thiết bị mà phải chờ từng đợt bàn giao từ nhà sản xuất. Do vậy, việc tối ưu cho hạ tầng tính toán chưa hoàn thiện để tranh thủ thời gian huấn luyện là cũng là một bài toán mà đội ngũ Zalo phải giải quyết.
Đồng thời, dữ liệu huấn luyện chất lượng cũng được đầu tư phát triển để bù đắp sự thiếu hụt về nguồn dữ liệu tiếng Việt.

"Mặc dù xuất phát điểm gặp nhiều khó khăn so với các công ty lớn trên thế giới nhưng Zalo vẫn quyết định nhập cuộc chơi từ sớm với mục tiêu phát triển thành công mô hình AI của riêng Việt Nam. Chúng tôi đã tham vấn kinh nghiệm từ các nhà nghiên cứu, kỹ sư tại nhiều viện nghiên cứu hàng đầu trên thế giới để có chiến lược phát triển phù hợp. Những dấu mốc thành công tới hiện tại là động lực để các kỹ sư Zalo tiếp tục tối ưu mô hình lớn hơn về lượng và tốt hơn về chất. Đồng thời khai thác tính ứng dụng để tạo ra nhiều sản phẩm AI đẳng cấp thế giới cho người dùng Việt", TS Nguyễn Trường Sơn, Giám đốc Khoa học tại Zalo AI.

Máy chủ DGX H100 Zalo đặt mua của Nvidia
Hiện mô hình AI của Zalo không chỉ thành công trên khía cạnh nghiên cứu huấn luyện mà còn đang được đưa vào ứng dụng, thúc đẩy việc tiếp cận và khai thác giá trị từ công nghệ mới tiên tiến cho người Việt.
Đầu năm 2025, Zalo ra mắt Trợ lý hỏi đáp tổng hợp Kiki Info đang được vận hành dưới dạng một OA - Official Account (Tài khoản chính thức) trên nền tảng nhắn tin Zalo. Trợ lý hỗ trợ hỏi đáp các chủ đề khác nhau trong cuộc sống, sáng tạo nội dung và giải trí. Theo thống kê của Zalo, trợ lý Kiki Info đã có tới 1 triệu lượt người dùng truy cập vào tài khoản OA trên Zalo chỉ trong chưa đầy 2 tháng.

Mô hình LLM của Zalo được ứng dụng để phát triển Trợ lý Kiki Info
Một ứng dụng khác của mô hình LLM của Zalo là thiệp AI cũng chạm mốc 15 triệu thiệp được khởi tạo và gửi đi chỉ trong 2 tháng. Đây là ứng dụng được đông đảo người dùng Zalo quan tâm để gửi những lời chúc tới người thân, bạn bè trong những dịp lễ quan trọng.
Hiện các ứng dụng từ mô hình ngôn ngữ lớn vẫn đang tiếp tục được Zalo mở rộng phát triển, hứa hẹn mang lại nhiều giá trị hữu ích cho người dùng trong nước.