Một người làm quan, cả họ được nhờ
Cách đây không lâu, ít người ở Trung Quốc biết đến Mililing, một ngôi làng buồn tẻ nép mình ở một góc hẻo lánh của phía nam tỉnh Quảng Đông. Nhưng mọi thứ đã thay đổi vào đầu năm nay khi hàng trăm du khách đến đây mỗi ngày để bày tỏ sự yêu mến đối với Liang Wenfeng, nhà sáng lập 40 tuổi của startup trí tuệ nhân tạo (AI) DeepSeek.
Dân làng dựng các quầy hàng gần ngôi nhà thời thơ ấu của Wenfeng để bán quà lưu niệm và đồ uống như nước mía.

Kể từ khi DeepSeek gây sốc cho Thung lũng Silicon và Phố Wall với mô hình lý luận mạnh mẽ vào tháng Giêng, Liang đã trở thành một trong những nhân vật có ảnh hưởng nhất của Trung Quốc, giống như các nhà khoa học hạt nhân và tên lửa của những năm 1950 và 1960, những người đã giúp thúc đẩy lợi thế chiến lược của quốc gia.
Trên toàn cầu, Liang được coi là một doanh nhân công nghệ đáng gờm, với tiềm năng làm lu mờ các đối thủ Mỹ như CEO OpenAI Sam Altman và định hình lại sự cạnh tranh Mỹ-Trung.
Một người bán hàng nói với phóng viên SCMP rằng Liang trở về làng trong dịp Tết Nguyên đán vừa qua cùng với các cảnh sát vũ trang, nhấn mạnh tầm quan trọng của ông đối với đất nước.
Khi Liang ra đời năm 1985, Trung Quốc vẫn chưa thoát khỏi cái bóng của một nền kinh tế bao cấp với tổng sản phẩm quốc nội (GDP) bình quân đầu người là 300 USD, các dịch vụ tài chính hạn chế và chưa có thị trường chứng khoán. Mililing vẫn là một làng quê truyền thống, nơi ai cũng biết nhau.
Liang học giỏi, đặc biệt là môn toán và vật lý. Năm 2022, nam sinh 17 tuổi đạt điểm cao nhất trong kỳ thi tuyển sinh đại học quốc gia ở khu vực Trạm Giang của Quảng Đông. Thành tích học tập xuất sắc giúp ông đậu Đại học Chiết Giang danh tiếng ở Hàng Châu.
Đại học Chiết Giang không kém cạnh Đại học Thanh Hoa và Đại học Bắc Kinh trong việc sản sinh ra các tỷ phú. Colin Huang Zheng, người sáng lập “gã khổng lồ” mua sắm trực tuyến PDD Holdings, với tài sản cá nhân ước tính khoảng 34 tỷ USD, là cựu sinh viên của trường.
Liang học kỹ thuật điện tử và tham gia chương trình sau đại học ba năm về thị giác máy vào năm 2007. Ông tốt nghiệp năm 2010 với luận án về thuật toán theo dõi đối tượng cho máy ảnh. Trong luận án, anh cảm ơn thầy hướng dẫn và năm bạn cùng lớp.
Thời gian của Liang ở Hàng Châu trùng với thời đại kinh tế sôi nổi, biến động thị trường chứng khoán và việc áp dụng nhanh chóng các công nghệ Internet bắt nguồn từ sự phổ biến của smartphone.
Thay vì làm thuê, Liang chọn tạo ra con đường của riêng mình. Tại Trung Quốc, thực tập là điều bắt buộc đối với một số chương trình học. Song, Liang là người duy nhất trong nhóm thực tập sinh đề nghị không đến văn phòng, theo SCMP.
Sau khi tốt nghiệp, Liang chuyển đến Thành Đô, thủ phủ Tứ Xuyên nổi tiếng với lối sống thoải mái. Tại đây, ông đã làm việc trong một dự án sử dụng các thuật toán để giao dịch chứng khoán, lấy cảm hứng từ nhà đầu tư quỹ đầu cơ huyền thoại người Mỹ James Simons. Liang đã viết lời nói đầu cho phiên bản Trung Quốc của cuốn tiểu sử về Simons.
Từ quỹ đầu cơ đến startup AI rúng động thế giới
Năm 2015, Liang đồng sáng lập quỹ đầu cơ High-Flyer Quant với Xu Ji, người bạn cùng lớp đại học. Theo một quảng cáo tuyển dụng cho High-Flyer Quant, người có tên “Mr L” bắt đầu giao dịch cổ phiếu bằng thuật toán với khoản đầu tư ban đầu là 80.000 NDT; trong 7 năm tiếp theo, ông đạt mức sinh lời hơn 100% hàng năm và trở thành tỷ phú.
High-Flyer nhanh chóng nổi tiếng và là một trong bốn quỹ đầu cơ hàng đầu của Trung Quốc, quản lý tài sản hơn 100 tỷ NDT. Nguồn lực này cho phép Liang xây dựng một trung tâm máy tính khổng lồ để phân tích dữ liệu và lựa chọn cổ phiếu.
Vào năm 2021, High-Flyer đã đầu tư 1 tỷ NDT để phát triển một trung tâm máy tính trang bị 10.000 card đồ họa Nvidia. Tuy nhiên, thành công cũng mang đến những thách thức. Vào năm 2022, High-Flyer đã trả lại tiền cho nhà đầu tư để giảm tài sản quản lý và mua cổ phiếu trong thời kỳ thị trường đi xuống.
Khi tài nguyên máy tính của High-Flyer vượt nhu cầu giao dịch hàng ngày, Liang chuyển hướng nghiên cứu AI. Năm 2019, ông thành lập phòng thí nghiệm AI.
Vào đầu năm 2023, chỉ vài tháng sau khi OpenAI ra mắt ChatGPT, phòng thí nghiệm chuyển thành một thực thể độc lập có tên DeepSeek, tập trung vào phát triển mô hình ngôn ngữ lớn (LLM).

Giữa bối cảnh LLM đông đúc, DeepSeek nổi lên như một nhà đổi mới thực sự, làm lu mờ cả các công ty công nghệ lớn. Việc phát hành mô hình nền tảng V3 mã nguồn mở vào tháng 12/2024 và mô hình lý luận R1 vào tháng 1/2025 đã tạo ra cuộc cách mạng cho thị trường AI trong nước.
Trong một cuộc phỏng vấn hồi tháng 3, “huyền thoại AI” Lee Kai-fu, người sáng lập và CEO startup 01.AI, cho biết đã ngừng phát triển các mô hình vì sự thành công của DeepSeek.
DeepSeek, công ty tuyển dụng hơn 100 nhà khoa học trẻ, đã sẵn sàng cho nhiều đột phá hơn. Với bản nâng cấp V3 gần đây, startup cho thấy họ không ngủ quên trên chiến thắng.
Các mô hình nguồn mở giá rẻ của DeepSeek cũng cung cấp một giải pháp thay thế khả thi cho các mô hình nguồn đóng đắt đỏ do Mỹ phát triển.
Bất chấp những lời khen ngợi, Liang không tỏ ra khoa trương. Sự xuất hiện đáng chú ý duy nhất của ông ấy là tại hội nghị chuyên đề cao cấp do Chủ tịch Trung Quốc Tập Cận Bình chủ trì vào tháng Hai.
Liang từ chối lời mời phát biểu tại Hội nghị thượng đỉnh hành động AI ở Paris trong cùng tháng và liên tục khước từ yêu cầu phỏng vấn, ngay cả khi phóng viên tụ tập bên ngoài trụ sở chính của DeepSeek trong một tòa nhà văn phòng cao cấp ở Hàng Châu.
Các nguồn tin tiết lộ ông cũng từ chối các cuộc họp với các nhà đầu tư tiềm năng và các quan chức chính quyền địa phương.
Đáng chú ý, Liang không hiện diện công khai trên mạng xã hội, một kỳ tích phi thường ngay cả theo tiêu chuẩn của các doanh nhân công nghệ ẩn dật Trung Quốc.
Bằng chứng duy nhất về sự liên quan của ông với DeepSeek là tên của ông xuất hiện trong các bài báo nghiên cứu được công ty công bố. Sự dè dặt của Liang trái ngược hoàn toàn với Altman, người tích cực quảng bá các sản phẩm của OpenAI trên toàn cầu.

Với những tiến bộ trong các kỹ thuật như kiến trúc MOE và MLA, DeepSeek đã giảm đáng kể chi phí đào tạo AI.
Quan trọng hơn, các mô hình của nó do chính các nhà khoa học Trung Quốc phát triển. Startup thúc đẩy cả nước Trung Quốc chạy đua ứng dụng các công nghệ AI trong các lĩnh vực khác nhau.
Dù DeepSeek không thể đáp ứng mọi nhu cầu, những ông lớn như Alibaba và Tencent Holdings mong muốn tích hợp các mô hình của DeepSeek vào các sản phẩm của riêng họ.
Thời gian tới, DeepSeek đối mặt với thách thức ngày một tăng khi gặp khó trong việc tiếp cận chip tiên tiến từ Mỹ.
Liang từng nói mục tiêu cuối cùng của DeepSeek là đạt được trí tuệ nhân tạo tổng hợp (AGI), giai đoạn mà AI có thể sánh ngang hoặc vượt quá khả năng nhận thức của con người.
"LLM sở hữu một số đặc điểm sơ bộ của AGI và có thể là con đường duy nhất dẫn đến AGI", ông nói.
Trong khi vẫn còn phải xem liệu DeepSeek có thể tiếp tục đổi mới hay không, Liang, người chỉ học tập ở Trung Quốc, đã trở thành nguồn cảm hứng cho thế hệ trẻ của quốc gia này.
Câu chuyện về ông được xuất hiện trong một áp phích ở trường tiểu học, còn các giáo viên thường xuyên nhắc đến ông như tấm gương cho các học sinh.
Nhiều học sinh nói sẽ viết về nhà sáng lập DeepSeek trong các bài kiểm tra văn học như một ví dụ về sự kiên trì, cống hiến và vượt qua nghịch cảnh.
(Theo SCMP)