Công nghệ

Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ

Cộng đồng công nghệ đang xôn xao trước thông tin một công ty luật quy mô trung bình vừa chi 35.000 USD - tương đương gần một tỷ đồng Việt Nam - để thuê một developer xây dựng hệ thống trí tuệ nhân tạo hoàn toàn riêng tư. Điều bất ngờ là thay vì chỉ trích về sự "phung phí", đa số ý kiến lại cho rằng con số này "cực kỳ hợp lý" và thậm chí là "rẻ bèo".

Câu chuyện bắt đầu khi một developer có tên u/eeko_systems chia sẻ trên Reddit về thương vụ lớn nhất trong sự nghiệp của mình. Thay vì sử dụng các dịch vụ AI có sẵn như ChatGPT hay Claude, công ty luật này quyết định đầu tư xây dựng một "pháo đài AI" hoàn toàn độc lập, không phụ thuộc vào bất kỳ nhà cung cấp nào.

Hệ thống được xây dựng dựa trên mô hình LLaMA 3 70B của Meta, được triển khai trên nền tảng CoreWeave với cấu hình dual A100 GPUs - những vi xử lý đồ họa mạnh nhất hiện tại dành cho AI. Điểm đặc biệt là toàn bộ dữ liệu và quá trình xử lý diễn ra hoàn toàn trong môi trường được kiểm soát bởi công ty luật, không có một byte thông tin nào rời khỏi hệ thống của họ.

Để hiểu được sự phức tạp của hệ thống này, hãy tưởng tượng một "siêu trợ lý" có thể đọc hiểu hàng ngàn trang tài liệu pháp lý trong vài giây, trả lời các câu hỏi phức tạp về luật, tóm tắt các vụ việc, và thậm chí có thể phân tích hợp đồng một cách chi tiết. Tất cả được thực hiện thông qua một giao diện web đơn giản mà bất kỳ luật sư nào trong công ty cũng có thể sử dụng.

Công nghệ đằng sau hệ thống này đòi hỏi sự kết hợp tinh vi của nhiều thành phần. ChromaDB đóng vai trò như một "thư viện số" khổng lồ, chuyển đổi tất cả tài liệu thành dạng dữ liệu mà AI có thể hiểu được. LlamaIndex hoạt động như một "người thư ký thông minh", giúp AI tìm kiếm và trích xuất thông tin chính xác từ núi tài liệu. Trong khi đó, n8n đảm nhận vai trò "điều phối viên", tự động hóa mọi quy trình từ việc tải tài liệu mới lên hệ thống đến gửi thông báo qua Slack và email.

Công ty luật đầu tư 35 . 000 USD xây dựng chatbot AI độc lập cho riêng mình - Ảnh 1.

Mô hình AI mã nguồn mở được công ty nói trên lựa chọn là Llama 3 phiên bản 70B của hãng Meta

Điều khiến cộng đồng công nghệ thán phục không chỉ là tính năng mà còn là mức độ bảo mật. Hệ thống được trang bị xác thực JWT, kiểm soát truy cập theo địa chỉ IP và ghi lại đầy đủ mọi hoạt động. Đây là những yêu cầu bắt buộc trong ngành luật, nơi mà việc rò rỉ thông tin có thể dẫn đến hậu quả pháp lý nghiêm trọng.

Tuy nhiên, tại sao 35.000 USD lại được coi là "rẻ" đối với một hệ thống như vậy? Câu trả lời nằm ở chi phí vận hành. Việc thuê dual A100 GPUs trên CoreWeave có thể tiêu tốn từ 6.000 đến 8.000 USD mỗi tháng, có nghĩa là chỉ riêng chi phí infrastructure trong một năm đã lên tới 72.000 đến 96.000 USD. Con số 35.000 USD để thiết lập toàn bộ hệ thống chỉ tương đương với 4-5 tháng chi phí vận hành.

Hơn nữa, nếu công ty luật quyết định tự xây dựng đội ngũ AI nội bộ, họ sẽ phải chi ít nhất 400.000 USD mỗi năm cho các chuyên gia về AI, DevOps và bảo mật, chưa kể đến thời gian và rủi ro trong quá trình phát triển. Các giải pháp enterprise từ những "ông lớn" như Microsoft hay Google thường có giá từ 100.000 đến 500.000 USD, nhưng vẫn phụ thuộc vào API bên thứ ba - điều mà nhiều công ty luật không thể chấp nhận được.

Công ty luật đầu tư 35 . 000 USD xây dựng chatbot AI độc lập cho riêng mình - Ảnh 2.

Mô hình AI mới DeepSeek R1-0528 có thể khiến việc tự triển khai các chatbot AI riêng cho mỗi công ty hiệu quả chi phí cao hơn

Thú vị hơn, ngay khi câu chuyện này đang được bàn tán sôi nổi, thì một sự kiện quan trọng khác diễn ra. DeepSeek, một startup AI từ Trung Quốc, vừa phát hành phiên bản "thu gọn" của mô hình R1, có thể chạy trên chỉ một GPU duy nhất thay vì cả chục GPU như trước đây. Điều này có nghĩa là chi phí thiết lập một hệ thống AI tương tự có thể giảm xuống còn 18.000 đến 22.000 USD, trong khi chi phí vận hành hàng năm chỉ còn 24.000 đến 36.000 USD.

Mô hình DeepSeek R1 thu gọn này không chỉ rẻ mà còn thể hiện hiệu suất ấn tượng, vượt qua Google Gemini 2.5 Flash trong các bài test toán học và gần bằng Microsoft Phi 4 trong các bài kiểm tra khác. Đặc biệt, tỷ lệ "ảo giác" - tình trạng AI đưa ra thông tin sai lệch - đã giảm 45-50% so với phiên bản trước đó.

Tuy nhiên, sự xuất hiện của DeepSeek cũng đặt ra những câu hỏi về tương lai. Liệu việc sử dụng công nghệ từ một startup Trung Quốc có phù hợp với các yêu cầu tuân thủ pháp lý của công ty luật Mỹ? Hiệu suất của mô hình nhỏ hơn có đủ để xử lý những tác vụ pháp lý phức tạp hay không? Đây là những câu hỏi mà các công ty luật cần cân nhắc kỹ lưỡng.

Điều thú vị là trong khi nhiều ngành khác vẫn đang do dự về việc áp dụng AI, các công ty luật lại thể hiện sự quyết đoán bất ngờ. Có lẽ bởi vì trong ngành luật, thời gian chính là tiền bạc theo nghĩa đen. Việc một AI có thể phân tích hàng nghìn trang tài liệu trong vài phút thay vì vài tuần có thể mang lại lợi nhuận khổng lồ.

if (pageSettings.allow3rd) admicroAD.unit.push(function () { admicroAD.show('admzonek1fs4xky') });

Các tin khác

Lenovo ra mắt laptop màn hình kép Yoga Book 9i

Lenovo ra mắt laptop màn hình kép Yoga Book 9i

Lenovo vừa chính thức ra mắt dòng Yoga Book 9i hướng tới những nhà sáng tạo và người dùng đa nhiệm, với thiết kế màn hình kép PureSight OLED độc đáo.
VnEconomy ra mắt nền tảng số Marcom-AI Platform cho các cơ quan báo chí

VnEconomy ra mắt nền tảng số Marcom-AI Platform cho các cơ quan báo chí

Ông Nguyễn Sỹ Hoàng, Phó tổng thư ký VnEconomy cho biết, Báo đã sử dụng nền tảng quản trị của các đối tác khác, nhưng không hài lòng bởi tòa soạn cần tự động hóa, tối ưu các hoạt động của phóng viên, biên tập và cần giọng nói theo yêu cầu...
Sắp có trại hè AI dành cho học sinh trong cả nước

Sắp có trại hè AI dành cho học sinh trong cả nước

Tổ chức ‘AI camp’ - Trại hè AI dành cho học sinh trên toàn quốc ngay trong kỳ nghỉ hè này, Đại học Công nghệ - Đại học Quốc gia Hà Nội muốn truyền cảm hứng, động lực về chuyển đổi số, phát triển và ứng dụng AI.
Thanh toán không tiền mặt thúc đẩy kinh tế số

Thanh toán không tiền mặt thúc đẩy kinh tế số

Chủ đề Ngày không tiền mặt 2025 là “Thanh toán không tiền mặt thúc đẩy kinh tế số”, chuỗi hoạt động chính của sự kiện sẽ diễn ra liên tục từ tháng 6 đến tháng 7/2025.
Thêm 1 cơ quan báo chí của Việt Nam bị tấn công mạng

Thêm 1 cơ quan báo chí của Việt Nam bị tấn công mạng

Thông tin từ Trung tâm An ninh mạng quốc gia A05 (Bộ Công an) cho biết mới đây, A05 đã phát hiện thêm 1 cơ quan báo chí của Việt Nam bị tấn công mạng. Trước đó, A05 đã phát hiện 3 cơ quan báo chí của Việt Nam bị tin tặc tấn công đánh cắp dữ liệu.