Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta

Hồi tháng 4, Meta đã hé lộ rằng họ đang phát triển một mô hình AI mã nguồn mở đầu tiên có hiệu suất ngang bằng với các mô hình riêng tư tốt nhất đến từ các công ty như OpenAI. Giờ đây mô hình đó đã ra mắt.

Meta đang phát hành Llama 3.1, mô hình AI mã nguồn mở lớn nhất từ trước đến nay, được công ty tuyên bố vượt trội hơn GPT-4o và Claude 3.5 Sonnet của Anthropic trên một số tiêu chuẩn đánh giá. Họ cũng đang mở rộng trợ lý AI Meta AI dựa trên Llama tới nhiều quốc gia và ngôn ngữ hơn, đồng thời bổ sung tính năng có thể tạo hình ảnh dựa trên diện mạo cụ thể của một người. CEO Mark Zuckerberg hiện dự đoán rằng Meta AI sẽ trở thành trợ lý được sử dụng rộng rãi nhất vào cuối năm nay, vượt mặt cả ChatGPT.

Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta nuôi tham vọng lật đổ ChatGPT- Ảnh 1.

So với các mô hình Llama 3 nhỏ hơn ra mắt cách đây vài tháng, Llama 3.1 phức tạp hơn đáng kể. Phiên bản lớn nhất có 405 tỷ tham số và được huấn luyện với hơn 16.000 GPU H100 cực kỳ đắt tiền của Nvidia. Meta không tiết lộ chi phí phát triển Llama 3.1, nhưng dựa trên chi phí của riêng các chip Nvidia, có thể ước tính con số này lên tới hàng trăm triệu USD.

Vậy, với chi phí như vậy, tại sao Meta tiếp tục cung cấp miễn phí Llama với giấy phép chỉ yêu cầu phê duyệt từ các công ty có hàng trăm triệu người dùng?

Trong một bức thư được đăng trên blog công ty của Meta, Zuckerberg lập luận rằng các mô hình AI mã nguồn mở sẽ vượt qua - và đang cải thiện nhanh hơn - các mô hình độc quyền, tương tự như cách Linux trở thành hệ điều hành mã nguồn mở vận hành cho hầu hết các điện thoại, máy chủ và thiết bị ngày nay.

Ông so sánh khoản đầu tư của Meta vào AI mã nguồn mở với dự án Open Compute Project trước đây, mà theo ông đã giúp công ty "tiết kiệm hàng tỷ USD" nhờ có các công ty bên ngoài như HP giúp cải thiện và chuẩn hóa thiết kế trung tâm dữ liệu của Meta khi công ty đang xây dựng năng lực của riêng mình. Nhìn về tương lai, ông kỳ vọng động lực tương tự sẽ diễn ra với AI, viết rằng, "Tôi tin rằng việc phát hành Llama 3.1 sẽ là một bước ngoặt trong ngành, khi hầu hết các nhà phát triển bắt đầu chủ yếu sử dụng mã nguồn mở."

Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta nuôi tham vọng lật đổ ChatGPT- Ảnh 2. — Các đối tác giúp Meta phát triển và hoàn thiện Llama-3

Để giúp đưa Llama 3.1 ra thế giới, Meta đang hợp tác với hơn hai chục công ty, bao gồm Microsoft, Amazon, Google, Nvidia và Databricks, để giúp các nhà phát triển triển khai phiên bản của riêng họ. Meta tuyên bố rằng chi phí vận hành Llama 3.1 trong sản xuất chỉ bằng khoảng một nửa so với GPT-4o của OpenAI. Họ đang phát hành trọng số mô hình để các công ty có thể đào tạo nó trên dữ liệu tùy chỉnh và điều chỉnh theo ý muốn.

Không có gì ngạc nhiên khi Meta không nói nhiều về dữ liệu họ sử dụng để đào tạo Llama 3.1. Những người làm việc tại các công ty AI nói rằng họ không tiết lộ thông tin này vì đó là bí mật thương mại, trong khi các nhà phê bình cho rằng đó là một chiến thuật để trì hoãn làn sóng không thể tránh khỏi của các vụ kiện bản quyền sắp tới.

Điều Meta sẽ nói là họ đã sử dụng dữ liệu tổng hợp, hoặc dữ liệu được tạo ra bởi một mô hình thay vì con người, để có phiên bản 405 tỷ tham số của Llama 3.1 cải thiện các phiên bản nhỏ hơn 70 tỷ và 8 tỷ. Ahmad Al-Dahle, Phó Chủ tịch AI tạo sinh của Meta, dự đoán rằng Llama 3.1 sẽ được các nhà phát triển ưa chuộng như "một giáo viên cho các mô hình nhỏ hơn sau đó được triển khai" theo "cách hiệu quả hơn về chi phí".

Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta nuôi tham vọng lật đổ ChatGPT- Ảnh 3. — Bảng so sánh giữa Llama 3.1 và các mô hình AI khác, danh sách không có Gemini vì Meta không sử dụng được API của Google để tái tạo kết quả so sánh.

Lần đầu tiên, việc kiểm tra đối kháng (hay red teaming) của Meta đối với Llama 3.1 bao gồm tìm kiếm các trường hợp sử dụng tiềm năng về an ninh mạng và sinh hóa học. Một lý do khác để kiểm tra mô hình kỹ lưỡng hơn là những gì Meta mô tả là các hành vi "tác nhân" mới nổi.

Theo ông Al-Dahle, một trong các ưu điểm của mô hình mới là khả năng tích hợp với API công cụ tìm kiếm để "truy xuất thông tin từ internet dựa trên một truy vấn phức tạp và gọi nhiều công cụ liên tiếp để hoàn thành nhiệm vụ của bạn." Một ví dụ khác ông đưa ra là yêu cầu mô hình vẽ biểu đồ số lượng nhà bán tại Mỹ trong 5 năm qua. "Nó có thể thực hiện tìm kiếm [web] cho bạn, tạo mã Python và thực thi nó."

Llama đang được chính Meta sử dụng để vận hành cho trợ lý AI của họ, với hy vọng biến nó thành một chatbot đa năng tương tự ChatGPT và có thể được tìm thấy ở hầu hết trong Instagram, Facebook và WhatsApp. Bắt đầu từ tuần này, Llama 3.1 sẽ được truy cập lần đầu tiên thông qua WhatsApp và trang web Meta AI ở Mỹ, sau đó là Instagram và Facebook trong những tuần tới. Nó cũng đang được cập nhật để hỗ trợ các ngôn ngữ mới, bao gồm tiếng Pháp, Đức, Hindi, Ý và Tây Ban Nha.

Mặc dù mô hình 405 tỷ tham số tiên tiến nhất của Llama 3.1 có thể sử dụng miễn phí trong Meta AI, trợ lý ảo này sẽ chuyển bạn sang mô hình 70 tỷ nhỏ hơn sau khi vượt quá một số lượng lời nhắc không xác định trong một tuần nhất định. Điều này cho thấy mô hình 405 tỷ vẫn quá đắt để Meta vận hành ở quy mô đầy đủ. Người phát ngôn Jon Carvill cho biết công ty sẽ cung cấp thêm thông tin về ngưỡng lời nhắc sau khi đánh giá mức sử dụng ban đầu.

Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta nuôi tham vọng lật đổ ChatGPT- Ảnh 4. — Tính năng Imagine Me của Meta AI được vận hành nhờ Llama-3.1

Một tính năng mới "Imagine Me" trong Meta AI quét khuôn mặt của bạn qua camera điện thoại để sau đó cho phép bạn chèn hình ảnh của mình vào các hình ảnh nó tạo ra. Bằng cách thu thập hình ảnh của bạn theo cách này chứ không phải thông qua ảnh trong hồ sơ của bạn, Meta hy vọng sẽ tránh được việc tạo ra một cỗ máy deepfake. Công ty nhận thấy nhu cầu của mọi người muốn tạo ra nhiều loại phương tiện AI hơn và chia sẻ chúng lên nguồn cấp dữ liệu của họ, ngay cả khi điều đó có nghĩa là làm mờ ranh giới giữa những gì có thể nhận biết là thật và không thật.

Meta AI cũng sẽ có mặt trên tai nghe Quest trong những tuần tới, thay thế giao diện điều khiển bằng giọng nói. Giống như việc triển khai trong kính Ray-Ban của Meta, bạn sẽ có thể sử dụng Meta AI trên Quest để nhận dạng và tìm hiểu về những gì bạn đang nhìn trong khi ở chế độ passthrough của tai nghe, hiển thị thế giới thực thông qua màn hình.

Ngoài dự đoán của Zuckerberg rằng Meta AI sẽ là chatbot được sử dụng nhiều nhất vào cuối năm nay (ChatGPT có hơn 100 triệu người dùng), Meta vẫn chưa chia sẻ bất kỳ con số sử dụng nào cho trợ lý của mình. "Tôi nghĩ toàn bộ ngành công nghiệp vẫn còn ở giai đoạn đầu trên con đường hướng tới sự phù hợp với thị trường sản phẩm," Al-Dahle nói. Ngay cả khi AI có thể đã cảm thấy được thổi phồng quá mức, rõ ràng là Meta và các công ty khác nghĩ rằng cuộc đua mới chỉ bắt đầu.

Ra mắt mô hình AI mã nguồn mở mạnh nhất thế giới, Meta nuôi tham vọng lật đổ ChatGPT

Đọc thêm

Thắt và gỡ đều phải kịp thời

Gelex và Chứng khoán VIX xuất hiện tại Eximbank

Gelex, Chứng khoán VIX là hai cổ đông có tỷ lệ sở hữu lớn nhất tại Eximbank

Loại rau dễ trồng giúp thải độc, ngừa ung thư

Người trẻ giúp phụ huynh chọn máy, lựa mạng, cả nhà cùng lên đời 4G trước "giờ G"

HSBC nâng dự báo tăng trưởng GDP Việt Nam: "Cú hích mạnh mẽ của nền kinh tế đã tới"

Tìm thấy hóa đơn 3.500 năm, lâu đời nhất thế giới

Một trung tâm thương mại kiếm 7 tỷ/ngày tại Việt Nam, cuối tuần nào cũng đông nghịt người lui đến

Khởi tố đối tượng lập hơn 1.200 hợp đồng cho vay nặng lãi tại Quảng Ninh

Duolingo - Startup thua lỗ suốt 10 năm bỗng trở thành hiện tượng với 12,5 triệu người theo dõi, doanh thu từ con số 0 lên hơn 500 triệu USD/năm

Huyền thoại Warren Buffett rót 135 tỷ USD mua 1 cổ phiếu thuộc lĩnh vực ông từng xa lánh: Thời cơ đến cho các nhà đầu tư?

Phong tỏa nhiều tuyến phố Hà Nội do ngập nước kéo dài

Người đầu tiên phản cung, khai "bị gây sức ép" trong vụ án FLC: Ký 3 Báo cáo tài chính trái luật, giá trị hợp đồng 100 triệu đồng

Nhiều doanh nghiệp cao su lãi lớn trong quý II nhờ giá bán tăng cao

Công ty ông Johnathan Hạnh Nguyễn thành cổ đông lớn của Nasco

Gửi tiết kiệm trên Sacombank Pay được tặng lãi suất lên đến 0,7%/năm

Từ 1/8, đặt cọc mua nhà trên giấy tối đa 5% giá bán, thanh toán lần đầu không quá 30% hợp đồng sẽ hạn chế rủi ro cho người mua

Huyện ngoại thành Hà Nội liên tục đấu giá đất, chuyên gia cảnh báo rủi ro

Một ngân hàng tăng mạnh lãi suất tiết kiệm từ hôm nay 24/7

TPHCM yêu cầu giải quyết tồn đọng tại chung cư Moscow Tower

Đối tác

Tin nổi bật

Chủ tịch Vietravel tâm tư về giới startup: Hãy nghĩ kỹ trước khi "đập đi xây lại" mô hình kinh doanh, vì thất bại nhiều quá thì "không người mẹ nào nuôi được mãi"

Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới "oai", trong khi thị trường nội còn khó hơn ngoại

Thị trường vốn Đông Nam Á: Việt Nam chỉ có duy nhất một thương vụ IPO, hút 37 triệu USD trong 10 tháng đầu năm

Căn hộ sơ cấp Tp.HCM chạm mốc cao nhất gần nửa tỉ đồng mỗi m2, sức cầu toàn thị trường phía Nam “bật tăng” tăng 93% so với năm ngoái

TS Cấn Văn Lực: ‘Chỉ có người đầu tư, gửi tiền mới thích lãi kép, còn những người đi vay không ai thích’

LPBank bất ngờ muốn chuyển Trụ sở chính, sẽ mua 5% vốn cổ phần FPT

Phó Thống đốc NHNN: "Từ 1/1/2025, tài khoản ngân hàng không xác thực thông tin căn cước công dân bị dừng giao dịch"

Hậu bão chốt deal từ cả 5 Shark trên Shark Tank, doanh nghiệp "khắc tinh" của thuốc trừ sâu nhận tiếp bão doanh số, mở rộng phân phối ra 8 tỉnh thành

Lần đầu tiên trên Shark Tank: Shark Minh xuống "deal in kind" chứ không ‘in cash’, dùng quyền lợi của "cá mập" để làm Co-founder chứ không rót tiền

Trai Tây bỏ việc đi chu du thế giới, chọn Việt Nam khởi nghiệp chuỗi phòng tập cho người giàu, lên Shark Tank nhận được "mưa lời khen" kèm "mưa lời từ chối"

Cùng chuyên mục

Đọc thêm

Đối tác

Tin nổi bật