Ngày này năm ngoái, Arthur Mensch, 31 tuổi, vẫn đang làm tại bộ phận Google Deepmind. Nhưng hiện anh là CEO của Mistral AI - startup được đánh giá có tiềm năng phát triển ngang hàng với các công ty công nghệ hàng đầu tại Thung lũng Silicon.
Mensch lớn lên ở vùng ngoại ô phía tây Paris, có mẹ là giáo viên vật lý còn cha kinh doanh công nghệ nhỏ. Với mái tóc đen dày, anh được đánh giá trông không giống một CEO công nghệ.
Sau khi theo học tại một số trường hàng đầu của Pháp về toán học và máy móc, Mensch hoàn thành luận án tiến sĩ năm 2018. Các giảng viên hướng dẫn nhận xét anh là một sinh viên luôn háo hức tham gia vào các dự án và thành thạo chúng ngay cả khi có ít kiến thức nền tảng.
"Tôi thích những trải nghiệm mới", Mensch nói với WSJ. "Tôi chán rất nhanh".
Mensch gia nhập bộ phận chuyên về trí tuệ nhân tạo Google DeepMind vào cuối 2020. Hai năm sau, anh là một trong những tác giả chính của bài báo về mô hình AI Chinchilla được đánh giá rất cao khi đó.
Nhưng khi cuộc đua AI nóng lên, Mensch cho biết anh thấy thất vọng khi các phòng thí nghiệm AI tư nhân lớn bắt đầu hạn chế xuất bản các bài báo hay chia sẻ các nghiên cứu về mô hình ngôn ngữ lớn (LLM). Khi ChatGPT xuất hiện, nội bộ Google cũng bắt đầu có cuộc đua ngầm, anh được chuyển sang làm việc trong nhóm 30 người thay vì 10 người.
"Tôi nghĩ nên rời đi ngay trước khi nó trở nên quá quan liêu với tôi. Tôi không muốn xây dựng một mô hình công nghệ mà mọi thứ không rõ ràng", Mensch cho hay.
Startup AI phát triển thần tốc
Mensch từng dành nhiều thời gian để tìm ra cách làm cho các hệ thống AI và máy học đạt hiệu quả ngày một tốt hơn. Năm ngoái, anh liên hệ với Timothée Lacroix, 32 tuổi và Guillaume Lample, 33 tuổi, lúc đó đang làm tại phòng thí nghiệm AI của Meta ở Paris để lập công ty mới.
Mistral - được đặt tên theo cơn gió mạnh bắt nguồn từ nước Pháp - ra đời, đặt văn phòng tại Paris. Khi bắt tay xây dựng công ty, anh không nghĩ quy mô khổng lồ là điều cần thiết, hay lĩnh vực công nghệ nhất thiết phải do một doanh nghiệp đến từ Mỹ thống trị.
"Tôi luôn trăn trở vì châu Âu không có nhiều công ty công nghệ lớn. Đây là cơ hội của chúng tôi để trở thành một trong số đó", Mensch nói.
Mistral AI huy động được hơn 500 triệu USD từ các nhà đầu tư, gồm nhà đầu tư mạo hiểm nổi danh Andreessen Horowitz (a16z), và trở thành "kỳ lân" khi được định giá hơn hai tỷ USD dù ra đời chưa được một năm. Con số đầu tư này nhỏ hơn so với hơn 10 tỷ USD mà Microsoft đổ vào OpenAI hay các hệ thống AI Google hiện tự nghiên cứu. Tuy nhiên, Mensch và các đồng sáng lập đã thành lập Mistral AI một phần dựa trên ý tưởng rằng phần lớn số tiền đó đang bị lãng phí.
"Chúng tôi muốn trở thành công ty sử dụng vốn hiệu quả nhất trong thế giới AI, Mensch nói. "Đó là lý do chúng tôi tồn tại".
Ngày 26/2, Mistral giới thiệu mô hình AI Mistral Large, "có khả năng trò chuyện và có thể suy luận giống con người", có thể thực hiện một số tác vụ suy luận tương đương với GPT-4 tiên tiến của OpenAI hay Gemini Ultra của Google. Quan trọng hơn, mô hình này có chi phí đào tạo chưa tới 22 triệu USD. Năm ngoái, CEO OpenAI Sam Altma nói mô hình AI của công ty tiêu tốn "nhiều hơn" mức 50-100 triệu USD.
Theo Business Insider, Mistral thu hút sự quan tâm từ khách hàng doanh nghiệp và nhà đầu tư, trong đó có Microsoft, kể từ khi startup này được thành lập hơn 5 tháng. Ngày 26/2, Microsoft nói đang bổ sung mô hình mới của Mistral như một tùy chọn cho nhà phát triển trên dịch vụ đám mây Azure, cũng như sở hữu một lượng cổ phần của công ty. Mistral cũng hợp tác và bán cổ phần cho một số tên tuổi trong lĩnh vực AI như Nvidia hay Saleforce.
Brian Bondy, nhà đồng sáng lập và Giám đốc công nghệ Brave Software, cho biết công ty ông đang dùng mặc định Mistral AI cho chatbot hỗ trợ trên website. "Chúng tôi nhận thấy Mistral AI cho chất lượng tương đương các mô hình độc quyền, nhưng cách tiếp cận nguồn mở cho phép Brave kiểm soát mô hình cục bộ tốt hơn", Bondy nói.
Eric Boyd, Phó chủ tịch phụ trách nền tảng AI của Microsoft, đánh giá Mistral "đưa ra một thử nghiệm hấp dẫn về việc kỹ thuật thông minh có thể thúc đẩy các hệ thống AI". Điều này giúp vận hành các cỗ máy AI với hiệu suất cao và chi phí ít hơn các mô hình đang có trên thế giới.
Đối với Mensch và cộng sự, việc phát hành hệ thống AI dưới dạng nguồn mở cho mọi người sử dụng miễn phí là một nguyên tắc quan trọng. Đó cũng là cách thu hút sự chú ý của các nhà phát triển và khách hàng tiềm năng mong muốn có nhiều quyền kiểm soát hơn đối với AI. Tuy nhiên, Mistral Large không phải nguồn mở.
"Rõ ràng đó là sự cân bằng mong manh giữa việc xây dựng mô hình kinh doanh và gắn bó với các giá trị nguồn mở của Mistral. Chúng tôi muốn phát minh ra những thứ mới, những kiến trúc mới nhưng vẫn muốn có thứ gì đó để bán thêm cho khách hàng của mình", Mensch nói thêm.