KH - Công Nghệ

Mô hình AI lớn của riêng Việt Nam: Bài toán sai ngay từ khởi đầu

Mô hình AI lớn của Việt Nam: Thách thức và cơ hội trong năm 2026 - Ảnh 1.


*Bài viết của tác giả Long Nguyễn, Chuyên gia CNTT, tư vấn chiến lược về chuyển đổi số.

Ngày 31 tháng 5 vừa qua, một hội nghị chuyên ngành lớn về AI tại TP.HCM đã đưa ra kết luận làm nổ phần bình luận của cộng đồng mạng: "Việt Nam không nên cố xây mô hình AI lớn." Chuyên gia từ Google DeepMind, Qualcomm bay về gật đầu đồng tình. Phần thảo luận bên ngoài hội thảo thì lại sôi nổi, đa chiều và có nhiều thứ để bàn hơn.

Mô hình ngôn ngữ lớn (LLM), thứ chạy phía sau ChatGPT hay Gemini, đòi hỏi hàng chục nghìn chip GPU, hàng trăm triệu đến hàng tỷ đô la, chạy liên tục nhiều tháng. Tiến sĩ Bùi Hải Hưng, người từng dẫn dắt VinAI Research, nói thẳng: chính VinAI đã thử và phải đổi hướng. Cạnh tranh với OpenAI khi người ta có 200.000 GPU, còn mình chỉ có vài trăm? Chúng ta đã thua trước khi đánh.

Phe phản biện lên tiếng ngay: Pháp có Mistral, UAE có Falcon, Singapore có SEA-LION, không phải là lớn nhất thế giới nhưng đủ tốt và nằm trong tầm kiểm soát. Việt Nam cũng đang có những dự án tương tự: GreenMind của VNG là LLM tiếng Việt mã nguồn mở đầu tiên trên nền tảng NVIDIA NIM. Những công ty công nghệ lớn như FPT, Viettel, VNPT đều có nỗ lực riêng đáng kể.

Cả hai phía đều có những lý lẽ đúng và tranh luận hay. Nhưng cả hai hình như đang chỉ nhìn một câu hỏi hẹp.

Có lẽ chúng ta đã cược nhầm ô?

Có một yếu tố nền tảng mà cả hai phía đều bỏ sót.

Yann LeCun, người đặt nền móng cho mạng thần kinh tích chập (CNN - nền tảng của phần lớn AI hiện đại), đã nhấn mạnh nhiều lần: LLM chỉ là máy thống kê ngôn ngữ cực kỳ tinh vi, không hiểu thế giới, không có bộ nhớ liên tục và thất bại với bài toán suy luận mà đứa trẻ ba tuổi giải được. Ông gọi cả ngành AI đang bị “nghiện LLM” đến mất phương hướng.

Mô hình AI lớn của Việt Nam: Thách thức và cơ hội trong năm 2026 - Ảnh 2.


Đầu năm 2026, ông đã đặt cược thật. LeCun rời Meta, lập AMI Labs tại Paris và huy động vốn hơn một tỷ đô la. Hướng đi của ông hoàn toàn khác: ông muốn xây dựng một mô hình thế giới (world models) - một hệ thống học cách thế giới vận hành thay vì chỉ chơi trò đoán chữ tiếp theo như cách hoạt động của LLM hiện nay. LeCun dự báo kiến trúc này sẽ thay thế LLM trong vài năm tới.

Quay lại bối cảnh đầu bài: chúng ta tranh cãi có nên xây dựng LLM riêng cho Việt Nam hay không, trong khi người tạo nền móng AI đang cược LLM sắp hết thời. Nếu Việt Nam mất ba năm để xây xong một LLM mà bốn năm nữa kiến trúc đó bị thay thế, thì câu chuyện hoàn vốn tính thế nào? Theo quan điểm của tôi, đây mới là câu hỏi đáng nghĩ.

GenAI (AI tạo sinh - ví dụ như ChatGPT, Gemini, các công cụ viết, tóm tắt, phân tích) sẽ không biến mất, vẫn hữu ích với hàng triệu người mỗi ngày. Nhưng GenAI chỉ là một nhánh nhỏ. Camera phát hiện lỗi dây chuyền sản xuất, cảm biến dự báo sâu bệnh đồng ruộng, hệ thống định tuyến logistics, AI trong máy bán hàng tự động: tất cả đều là AI, tạo giá trị thật và không cần mô hình tiên phong (frontier model) nào. Nhầm GenAI với AI nói chung thì dễ rơi vào hai cực: ưa thích quá mức hoặc chối bỏ quá mức. Ứng dụng thực tiễn của AI lại nằm ở khoảng giữa mà ít ai nhìn vào.

Câu hỏi sâu hơn nằm ở tầng khác. Hai mươi năm qua, "chủ quyền số" được hiểu ở tầng vật lý: ai sở hữu cáp quang, ai nắm trung tâm dữ liệu. Thế nhưng khi mô hình ngôn ngữ bắt đầu tóm tắt hồ sơ y tế, phân tích hợp đồng, hỗ trợ quyết định tuyển dụng, nó cũng vô tình định hình cách người dùng tư duy. Hệ thống huấn luyện trên văn bản tiếng Anh hiểu tập quán thương mại Việt Nam hay pháp lý nội địa theo cách rất khác với thực tế đang chạy. Phụ thuộc vào hạ tầng vật lý thì đáng lo, phụ thuộc vào cách máy nghĩ hộ còn đáng lo hơn.

Không có quốc gia nào tự cung tự cấp AI hoàn toàn. BCG đầu năm 2026 gọi ra một mục tiêu thực tế hơn mà các nước hiện chưa sở hữu công nghệ AI nên nhắm đến, là "khả năng phục hồi" (resilience): đó là có đủ năng lực để không bị khóa cứng vào một nhà cung cấp và hiểu được AI đang tạo ra cái gì. Ở khía cạnh này, GreenMind, dù nhỏ hơn GPT rất nhiều, vẫn có giá trị chiến lược vì hiểu bối cảnh Việt Nam và kiểm soát được.

Xây xong, ai trả tiền?

Giả sử chúng ta xây xong một LLM tiếng Việt đủ tốt thì thị trường có nuôi nổi mô hình này không, khi mà phần lớn các công ty AI trên thế giới đều đang “đốt tiền”?

81% người dùng Internet Việt Nam tương tác với công cụ AI hàng ngày, dẫn đầu Đông Nam Á. Nghe ấn tượng. Nhưng chỉ 18% doanh nghiệp dùng AI thường xuyên, và 74% trong số đó vẫn ở mức viết email, tóm tắt văn bản, tra cứu. Cá nhân xài miễn phí, doanh nghiệp chưa quen trả tiền. Thị trường sẵn sàng chi cho LLM tiếng Việt chuyên sâu vẫn rất hẹp.

Mô hình AI lớn của Việt Nam: Thách thức và cơ hội trong năm 2026 - Ảnh 3.

Tác giả Long Nguyễn, Chuyên gia CNTT, tư vấn chiến lược về chuyển đổi số.

Rủi ro thật: xây xong mà thị trường chưa chín. Chi phí vận hành LLM mỗi ngày dù không có người dùng thì là tiền thật, tính bằng điện và chip. Chờ lâu thì không nổi.

Chiến lược mã nguồn mở là lựa chọn thông minh hơn so với việc xây dựng các mô hình tính phí ngay: đó là mở hệ sinh thái để nhà phát triển tự tinh chỉnh cho bài toán của họ, xây dựng cộng đồng song song với việc xây dựng mô hình. Nuôi thị trường cùng lúc nuôi sản phẩm.

Trong khi bài toán vĩ mô còn nhiều tranh cãi, thì vẫn có những ví dụ đang chạy thật. Masan tích hợp AI vào chuỗi bán lẻ WinX và máy bán hàng tự động để dự báo nhu cầu và tự động bổ sung hàng cho 15 triệu thành viên. MoMo dùng học máy trong trợ lý tài chính Moni, phân tích chi tiêu thời gian thực cho hơn 30 triệu người dùng. Không ai tự xây LLM theo kiểu OpenAI. Họ chỉ đơn giản là dùng đúng công cụ, ra đúng bài toán và chạy thật.

Cá nhân tôi thấy cả hai phía đều đúng. Đốt ngân sách chỉ để theo đuổi mô hình tiên phong là lãng phí. Nhưng nếu bỏ qua hoàn toàn năng lực AI nội địa thì lại là một rủi ro chiến lược.

Câu trả lời phụ thuộc vào việc bạn đang đứng ở đâu. Với người dùng cá nhân, bạn chỉ cần quan tâm đến công cụ AI nào có thể giúp bạn ngay hôm nay? Với người xây dựng sản phẩm: bài toán cụ thể là gì, đo kết quả thế nào? Với doanh nghiệp: làm sao để tiết kiệm chi phí nhất có thể mà vẫn có thể áp dụng được AI có lợi cho doanh nghiệp của mình theo đúng luật? Tranh luận về mô hình tiên phong và chủ quyền số thì quan trọng thật, nhưng đó là bài của nhà hoạch định và nhà đầu tư dài hạn với số tiền khổng lồ.

Sau tất cả, đọc xong bài này thì bạn lại gõ gì tiếp vào ChatGPT, Gemini hay đi tìm một điều gì đó sâu hơn?

Các tin khác