Công nghệ

Một hãng luật tốn gần một tỷ đồng để tự build "ChatGPT" trên dữ liệu riêng, dân mạng xem xong vẫn gật gù khen rẻ

Cộng đồng công nghệ đang xôn xao trước thông tin một công ty luật quy mô trung bình vừa chi 35.000 USD - tương đương gần một tỷ đồng Việt Nam - để thuê một developer xây dựng hệ thống trí tuệ nhân tạo hoàn toàn riêng tư. Điều bất ngờ là thay vì chỉ trích về sự "phung phí", đa số ý kiến lại cho rằng con số này "cực kỳ hợp lý" và thậm chí là "rẻ bèo".

Câu chuyện bắt đầu khi một developer có tên u/eeko_systems chia sẻ trên Reddit về thương vụ lớn nhất trong sự nghiệp của mình. Thay vì sử dụng các dịch vụ AI có sẵn như ChatGPT hay Claude, công ty luật này quyết định đầu tư xây dựng một "pháo đài AI" hoàn toàn độc lập, không phụ thuộc vào bất kỳ nhà cung cấp nào.

Hệ thống được xây dựng dựa trên mô hình LLaMA 3 70B của Meta, được triển khai trên nền tảng CoreWeave với cấu hình dual A100 GPUs - những vi xử lý đồ họa mạnh nhất hiện tại dành cho AI. Điểm đặc biệt là toàn bộ dữ liệu và quá trình xử lý diễn ra hoàn toàn trong môi trường được kiểm soát bởi công ty luật, không có một byte thông tin nào rời khỏi hệ thống của họ.

Để hiểu được sự phức tạp của hệ thống này, hãy tưởng tượng một "siêu trợ lý" có thể đọc hiểu hàng ngàn trang tài liệu pháp lý trong vài giây, trả lời các câu hỏi phức tạp về luật, tóm tắt các vụ việc, và thậm chí có thể phân tích hợp đồng một cách chi tiết. Tất cả được thực hiện thông qua một giao diện web đơn giản mà bất kỳ luật sư nào trong công ty cũng có thể sử dụng.

Công nghệ đằng sau hệ thống này đòi hỏi sự kết hợp tinh vi của nhiều thành phần. ChromaDB đóng vai trò như một "thư viện số" khổng lồ, chuyển đổi tất cả tài liệu thành dạng dữ liệu mà AI có thể hiểu được. LlamaIndex hoạt động như một "người thư ký thông minh", giúp AI tìm kiếm và trích xuất thông tin chính xác từ núi tài liệu. Trong khi đó, n8n đảm nhận vai trò "điều phối viên", tự động hóa mọi quy trình từ việc tải tài liệu mới lên hệ thống đến gửi thông báo qua Slack và email.

Công ty luật đầu tư 35 . 000 USD xây dựng chatbot AI độc lập cho riêng mình - Ảnh 1.

Mô hình AI mã nguồn mở được công ty nói trên lựa chọn là Llama 3 phiên bản 70B của hãng Meta

Điều khiến cộng đồng công nghệ thán phục không chỉ là tính năng mà còn là mức độ bảo mật. Hệ thống được trang bị xác thực JWT, kiểm soát truy cập theo địa chỉ IP và ghi lại đầy đủ mọi hoạt động. Đây là những yêu cầu bắt buộc trong ngành luật, nơi mà việc rò rỉ thông tin có thể dẫn đến hậu quả pháp lý nghiêm trọng.

Tuy nhiên, tại sao 35.000 USD lại được coi là "rẻ" đối với một hệ thống như vậy? Câu trả lời nằm ở chi phí vận hành. Việc thuê dual A100 GPUs trên CoreWeave có thể tiêu tốn từ 6.000 đến 8.000 USD mỗi tháng, có nghĩa là chỉ riêng chi phí infrastructure trong một năm đã lên tới 72.000 đến 96.000 USD. Con số 35.000 USD để thiết lập toàn bộ hệ thống chỉ tương đương với 4-5 tháng chi phí vận hành.

Hơn nữa, nếu công ty luật quyết định tự xây dựng đội ngũ AI nội bộ, họ sẽ phải chi ít nhất 400.000 USD mỗi năm cho các chuyên gia về AI, DevOps và bảo mật, chưa kể đến thời gian và rủi ro trong quá trình phát triển. Các giải pháp enterprise từ những "ông lớn" như Microsoft hay Google thường có giá từ 100.000 đến 500.000 USD, nhưng vẫn phụ thuộc vào API bên thứ ba - điều mà nhiều công ty luật không thể chấp nhận được.

Công ty luật đầu tư 35 . 000 USD xây dựng chatbot AI độc lập cho riêng mình - Ảnh 2.

Mô hình AI mới DeepSeek R1-0528 có thể khiến việc tự triển khai các chatbot AI riêng cho mỗi công ty hiệu quả chi phí cao hơn

Thú vị hơn, ngay khi câu chuyện này đang được bàn tán sôi nổi, thì một sự kiện quan trọng khác diễn ra. DeepSeek, một startup AI từ Trung Quốc, vừa phát hành phiên bản "thu gọn" của mô hình R1, có thể chạy trên chỉ một GPU duy nhất thay vì cả chục GPU như trước đây. Điều này có nghĩa là chi phí thiết lập một hệ thống AI tương tự có thể giảm xuống còn 18.000 đến 22.000 USD, trong khi chi phí vận hành hàng năm chỉ còn 24.000 đến 36.000 USD.

Mô hình DeepSeek R1 thu gọn này không chỉ rẻ mà còn thể hiện hiệu suất ấn tượng, vượt qua Google Gemini 2.5 Flash trong các bài test toán học và gần bằng Microsoft Phi 4 trong các bài kiểm tra khác. Đặc biệt, tỷ lệ "ảo giác" - tình trạng AI đưa ra thông tin sai lệch - đã giảm 45-50% so với phiên bản trước đó.

Tuy nhiên, sự xuất hiện của DeepSeek cũng đặt ra những câu hỏi về tương lai. Liệu việc sử dụng công nghệ từ một startup Trung Quốc có phù hợp với các yêu cầu tuân thủ pháp lý của công ty luật Mỹ? Hiệu suất của mô hình nhỏ hơn có đủ để xử lý những tác vụ pháp lý phức tạp hay không? Đây là những câu hỏi mà các công ty luật cần cân nhắc kỹ lưỡng.

Điều thú vị là trong khi nhiều ngành khác vẫn đang do dự về việc áp dụng AI, các công ty luật lại thể hiện sự quyết đoán bất ngờ. Có lẽ bởi vì trong ngành luật, thời gian chính là tiền bạc theo nghĩa đen. Việc một AI có thể phân tích hàng nghìn trang tài liệu trong vài phút thay vì vài tuần có thể mang lại lợi nhuận khổng lồ.

Các tin khác

Giá vàng đồng loạt tăng

Sáng nay (6/6), giá vàng trong nước đồng loạt tăng trở lại. Theo đó, vàng miếng SJC tiến sát mốc 118 triệu đồng/lượng và duy trì cao hơn giá vàng nhẫn 1,2 - 4 triệu đồng/lượng, tùy từng thương hiệu vàng.

Kiểm tra đột xuất một Công ty

Lực lượng chức năng đã tạm giữ gần 4 tấn thực phẩm đông lạnh tại Công ty TNHH xuất nhập khẩu Thịnh Phát Food.

Giá vàng quay đầu giảm mạnh

Sáng nay (4/6), giá vàng trong nước quay đầu giảm mạnh. Theo đó, vàng miếng SJC lại quay về quanh mốc 117 triệu đồng/lượng.

Cận cảnh những chiếc bao tải chứa 12 tấn chân gà bốc mùi hôi thối trong kho đông lạnh của ông chủ sinh năm 1982

Lực lượng Quản lý thị trường (QLTT) tỉnh Quảng Ninh vừa phát hiện và thu giữ hơn 12 tấn chân gà không rõ nguồn gốc tại một kho đông lạnh ở thành phố Cẩm Phả. Toàn bộ số hàng đã bốc mùi, không có hóa đơn, chứng từ hợp pháp và đang được tạm giữ để xử lý theo quy định.

Giá vàng tăng đồng loạt

9h30 sáng nay (3/6), Công ty Vàng bạc đá quý Sài Gòn niêm yết giá vàng miếng SJC 116 - 118 triệu đồng/lượng mua vào - bán ra, tăng 200.000 đồng/lượng so với đầu giờ sáng. Trong khi đó, giá vàng nhẫn được điều chỉnh tăng mạnh.

Sự bất nhất của C.P. Việt Nam

Trước khi thừa nhận hình ảnh heo bệnh là thật vào hôm nay thì chính Công ty C.P. Việt Nam lại từng tuyên bố những hình ảnh này "không rõ nguồn gốc, thời gian và không phải là sản phẩm của công ty".

Bộ Y tế đề xuất lập Quỹ Phòng bệnh

Bộ Y tế đang đề xuất xây dựng Luật Phòng bệnh, thay thế Luật Phòng, chống bệnh truyền nhiễm năm 2007, nhằm thể chế hóa các chủ trương, định hướng của Đảng và khắc phục những bất cập trong chăm sóc sức khỏe nhân dân, đặc biệt là trong công tác phòng chống dịch bệnh. Một trong những nội dung nổi bật của dự thảo là việc thành lập Quỹ Phòng bệnh.