Công nghệ

Phần mềm ngăn siêu AI bịa đặt câu trả lời

Phần mềm NeMo Guardrails, được Nvidia công bố hôm 25/4, được đánh giá là một trong những bước tiến quan trọng của trí tuệ nhân tạo nhằm giải quyết vấn đề siêu AI bị "ảo giác" - vấn đề lớn mà những mô hình AI tạo sinh như GPT của OpenAI hay LaMDA của Google đang gặp phải.

Các siêu AI như ChatGPT, Bard được đào tạo trên hàng terabyte dữ liệu để trả lời như con người. Tuy nhiên, chúng có một xu hướng xấu là có thể bịa ra nội dung. Trong cuộc phỏng vấn với CBS tuần trước, CEO Google Sundar Pichai thừa nhận ngay cả hãng cũng không hiểu đầy đủ về AI khi nó có thể tạo ra câu trả lời có phần ngớ ngẩn, thậm chí nguy hiểm.

NeMo Guardrails có thể giảm thiểu các câu trả lời tự bịa bằng cách thêm nhiều lớp ngăn AI nói ra chủ đề ngoài tầm hiểu biết. Phần mềm mới buộc chatbot chỉ nói về một chủ đề cụ thể, loại bỏ nội dung độc hại và hạn chế việc thực thi các lệnh có hại trên máy tính.

"Một siêu AI cần được mã hóa cứng trong các logic thực thi của hệ thống bảo vệ, đảm bảo không nói luyên thuyên những thứ ngoài chủ đề người dùng đang đề cập hoặc nhắc đến nội dung độc hại", Jonathan Cohen, Phó chủ tịch nghiên cứu ứng dụng của Nvidia, nói.

Jonathan Cohen, phó chủ tịch nghiên cứu ứng dụng của Nvidia. Ảnh: Nvidia

Jonathan Cohen, Phó chủ tịch nghiên cứu ứng dụng của Nvidia. Ảnh: Nvidia

Trong lĩnh vực phần cứng, Nvidia hiện chiếm hơn 95% thị trường chip đào tạo AI và đang cung cấp hàng nghìn bộ xử lý đồ họa cần thiết để xây dựng những siêu AI như ChatGPT.

Mô hình hoạt động của "cảnh sát AI"

NeMo Guardrails là lớp phần mềm nằm giữa người dùng và mô hình ngôn ngữ lớn hoặc các siêu AI. Nó lọc những kết quả được cho là độc hại của AI, giảm khả năng đưa ra câu trả lời vô nghĩa, hoặc từ khóa xấu có thể xuất hiện trong dữ liệu học máy của các nền tảng.

Cohen lấy ví dụ một chatbot phục vụ khách hàng, được thiết kế để nói về sản phẩm của công ty, sẽ được NeMo Guardrails hạn chế tối đa việc nói về các sản phẩm của đối thủ cạnh tranh dù được khách hàng hỏi. Thậm chí, phần mềm có thể ngăn chatbot trả lời những câu liên quan đến nhân sự nội bộ và thông tin bảo mật của công ty.

Giao diện một đoạn chat của ChatGPT. Ảnh: Lưu Quý

Giao diện một đoạn chat của ChatGPT. Ảnh: Lưu Quý

"Cảnh sát AI" của Nvidia dùng một mô hình ngôn ngữ lớn khác để kiểm tra câu trả lời tự bịa của siêu AI. Nếu chatbot không đưa ra câu trả lời phù hợp, Nemo Guardrails sẽ không hiển thị nội dung đến người dùng. NeMo Guardrails được cung cấp dưới dạng nguồn mở thông qua các dịch vụ của Nvidia và có thể dùng trong ứng dụng thương mại.

Các công ty AI như Google, OpenAI, Microsoft cũng đang ngăn AI tự bịa nội dung hoặc nói thông tin độc hại bằng cách để con người "dạy" AI. Tuy nhiên, điều này cũng gây nên một làn sóng tranh cãi về đạo đức nghề nghiệp và rủi ro liên quan đến vấn đề thiên vị giới tính, sắc tộc.

(theo CNBC)

Các tin khác

Dữ liệu "bẩn" phía sau siêu AI

Dữ liệu "bẩn" phía sau siêu AI

Google, Meta sử dụng bộ dữ liệu "đã làm sạch" để đào tạo AI, nhưng thực tế vẫn còn chứa nội dung độc hại và nguy hiểm.
Đam mê mới của Mark Zuckerberg

Đam mê mới của Mark Zuckerberg

Mark Zuckerberg được cho là đã bị AI mê hoặc, và các nhà phân tích đùa rằng CEO Meta đang tính đến chuyện đổi tên công ty thành MetAI.
HP ra máy in laser đa chức năng khổ A3

HP ra máy in laser đa chức năng khổ A3

Dòng máy LaserJet Managed MFP E800/E700 hỗ trợ đồng thời photo, in và scan tài liệu; công suất in tối đa 300.000 trang mỗi tháng, tối ưu hiệu suất doanh nghiệp.
Loạt màn hình gaming mạnh nhất của LG

Loạt màn hình gaming mạnh nhất của LG

LG cung cấp đa dạng dòng màn hình gaming UltraGear với tần số quét đến 240 Hz, tốc độ phản hồi 0,03 ms, đáp ứng nhu cầu từ cao cấp đến tầm trung.
Trung Quốc sắp tự làm chip nhớ

Trung Quốc sắp tự làm chip nhớ

Hãng chip nhớ hàng đầu Trung Quốc YMTC sẽ dùng toàn bộ thiết bị từ công ty nội địa thay vì nguồn nước ngoài để sản xuất từ năm tới.
"Mùa đông bán dẫn" đang kéo dài

"Mùa đông bán dẫn" đang kéo dài

Nhu cầu chip dành cho máy tính và smartphone suy yếu khiến khủng hoảng dư thừa của ngành bán dẫn có thể kéo dài hơn dự báo.
Twitter rối loạn vì tích xanh

Twitter rối loạn vì tích xanh

Tài khoản Twitter của một số người đã mất bỗng được cấp tích xanh, trong khi nhiều người nổi tiếng lại không còn dấu xác thực.
Trung Quốc khát nhân tài AI

Trung Quốc khát nhân tài AI

Nhu cầu về nhân tài AI của Trung Quốc đã tăng gấp ba lần so với 5 năm trước, nhưng chỉ có một số rất ít đạt trình độ cao.