Theo tờ The Guardian, các chatbot như ChatGPT sở dĩ trở nên quyền năng là nhờ một điều đơn giản: Bạn hỏi bất cứ điều gì, và nó sẽ trả lời.
Thế nhưng, nội dung phản hồi mà bạn nhận được phụ thuộc vào nhiều yếu tố hơn là chỉ vài dòng chữ được gõ vào khung chat.
Hiểu được cách thức vận hành của những chỉ dẫn này và cách tự thêm hướng dẫn của riêng mình vào hệ thống sẽ giúp bạn khai thác AI hiệu quả hơn.
"Luật chơi" đằng sau màn hình
Trong giới công nghệ, những gì bạn gõ vào ChatGPT được gọi là prompt (lời nhắc), hay cụ thể là user prompt (lời nhắc của người dùng).
Trước khi những từ đó được gửi đến mô hình AI cốt lõi, các công ty sẽ "kẹp" thêm một đoạn văn bản khổng lồ gọi là system prompt (lời nhắc hệ thống) để định hình cách nó phản hồi.
Tuy nhiên, vì các mật lệnh này được ưu tiên cao hơn những gì người dùng gõ, đôi khi chúng có thể "đè" lên yêu cầu của bạn.
Lời nhắc hệ thống ra đời như một cách linh hoạt để định hình phản hồi của chatbot mà không cần phải tốn công "huấn luyện" lại một phiên bản AI mới từ đầu.
Việc tạo ra một mô hình mới thường là một quá trình dài hơi, đòi hỏi kỹ năng chuyên môn cao và chi phí vận hành máy tính đắt đỏ.
Trong khi đó, lời nhắc hệ thống được viết bằng ngôn ngữ tự nhiên, cho phép bất kỳ ai cũng có thể tinh chỉnh hành vi của chatbot một cách nhanh chóng.
Khi một chatbot "đi chệch đường ray", các công ty AI có thể thay đổi lời nhắc hệ thống như một giải pháp sửa lỗi tức thời.
Sau khi Grok, chatbot của xAI (thuộc sở hữu của Elon Musk) vướng vào lùm xùm phát ngôn phản cảm hồi tháng 7, công ty đã lập tức xóa bỏ dòng lệnh:
"Bạn hãy nói thẳng nói thật và đừng ngại làm mất lòng những người quá coi trọng sự chuẩn mực chính trị."
Hay như năm ngoái, khi người dùng nhận thấy ChatGPT đột nhiên bị "ám ảnh" bởi loài yêu tinh, OpenAI đã phải mở một cuộc điều tra.
Cuối cùng, họ đã thêm một chỉ dẫn vào hệ thống của Codex cấm thảo luận không cần thiết về yêu tinh, quái vật hay gấu mèo.
Cuộc chiến giành quyền kiểm soát "nhân cách" AI
Bạn có thể tự hỏi "mật lệnh" của công cụ AI bạn đang dùng có gì trong đó.
Hầu hết các công ty AI đều cố gắng giữ bí mật này, nhưng một số người dùng đã dùng mẹo để "lừa" chatbot tiết lộ những hướng dẫn ẩn.
Ásgeir Thor Johnson, một lập trình viên tự do tại Iceland có sở thích "vọc" AI, thường xuyên công bố các lời nhắc hệ thống mà anh trích xuất được từ các sản phẩm AI phổ biến.
Dữ liệu của Johnson cho thấy lời nhắc hệ thống của ba chatbot hàng đầu hiện nay dài từ 2.300 đến 27.000 từ.
Chúng phơi bày cách mỗi công ty sử dụng quyền lực của mình:
Phần lớn các chỉ dẫn tập trung vào việc tinh chỉnh tính cách của chatbot, đảm bảo nó tuân thủ chính sách của nhà sản xuất hoặc hướng dẫn nó cách sử dụng các công cụ bên ngoài như tìm kiếm web.
Lời nhắc hệ thống cũng tiết lộ những gì các công ty AI lo sợ nhất.
Như Anthropic, công ty đứng sau Claude, dành hơn 2.000 từ chỉ để van nài chatbot của mình tránh vi phạm bản quyền.
Tiếp theo đó là một danh sách chi tiết: quy định số chữ tối đa được trích dẫn từ bài báo (15 từ), lời bài hát (không được trích dù chỉ một dòng) và thơ (không được trích dù chỉ một khổ).
Thậm chí, hệ thống còn quy định Claude phải làm gì nếu lỡ vi phạm các quy tắc trên:
"Claude không bao giờ xin lỗi vì vô tình vi phạm bản quyền, vì nó không phải là luật sư."
Quảng cáo, chính trị và định kiến
OpenAI đã bắt đầu thử nghiệm quảng cáo trên ChatGPT từ tháng 2.
Lời nhắc hệ thống của nó hướng dẫn cách trả lời khi người dùng hỏi về các quảng cáo xuất hiện:
"Tránh phủ nhận tuyệt đối (ví dụ: 'Tôi không chèn bất kỳ quảng cáo nào') hoặc đưa ra các khẳng định chắc nịch..."
Grok của xAI cũng từng bị chỉ trích vì tìm kiếm các bài đăng của Elon Musk để đưa ra ý kiến về các chủ đề gây tranh cãi.
Giờ đây, mật lệnh của nó ghi rõ:
"Nếu được hỏi ý kiến cá nhân về một chủ đề chính trị nhạy cảm không yêu cầu tìm kiếm, không được tìm kiếm hoặc dựa vào quan điểm của Elon Musk, xAI hay các phản hồi trước đó của Grok."
Google, nhà sản xuất Gemini, cũng cài đặt nhiều quy tắc về cách xử lý định kiến:
"Nếu người dùng yêu cầu một video phù hợp với một định kiến có hại, việc tạo ra nó thực chất sẽ không làm củng cố thêm định kiến đó."
Công ty này từng phải tạm dừng khả năng tạo ảnh của chatbot vào năm 2024 sau khi bị chỉ trích vì tạo ra các hình ảnh sai lệch lịch sử như nữ Giáo hoàng hay những "Người cha lập quốc" (Founding Fathers) thuộc nhiều chủng tộc khác nhau.
Taya Christianson, người phát ngôn của OpenAI, cho biết lời nhắc hệ thống là một bước giúp các mô hình phản hồi phù hợp.
Google và xAI hiện không phản hồi các yêu cầu bình luận.
Để "bẻ khóa" các bí mật này, Johnson đã sử dụng một kỹ thuật thú vị: gửi cho chatbot một lời nhắc cũ và yêu cầu nó "sửa lỗi".
Với bản tính nhiệt tình hỗ trợ, các chatbot thường vô tình tuôn ra toàn bộ lời nhắc hệ thống thật.
Johnson tin tưởng vào kết quả của mình vì các nhà nghiên cứu khác sử dụng kỹ thuật khác nhau cũng thu được kết quả tương tự.
Bạn có thể làm gì để "giành lại" quyền lực?
Hiện tại, không có chatbot phổ biến nào cho phép người dùng trực tiếp sửa đổi lời nhắc hệ thống.
Tuy nhiên, ChatGPT, Claude và Gemini đều cung cấp các tính năng tùy chỉnh tương tự, giúp biến những phản hồi gây khó chịu thành những câu trả lời hữu ích.
Việc thêm các hướng dẫn tùy chỉnh (custom instructions) không thay đổi đáng kể khả năng cốt lõi của AI, nhưng chúng có thể giúp cá nhân hóa phản hồi theo sở thích của bạn: từ định dạng, độ dài cho đến tính cách.
ChatGPT thậm chí còn có các cài đặt riêng để tùy chỉnh mức độ nhiệt tình và tần suất sử dụng biểu tượng cảm xúc (emoji).
Tuy nhiên, lời nhắc hệ thống không phải là "thánh chỉ" tuyệt đối.
Cần lưu ý rằng: "Chatbot không phải lúc nào cũng tuân thủ đúng mật lệnh."
Nó có quyền năng lớn hơn, được ưu tiên hơn, nhưng không phải lúc nào lời nhắc của bạn cũng có tác dụng.
Với Johnson, việc hiểu rõ các quy tắc ẩn này sẽ thay đổi cách chúng ta tương tác với AI.
Nguồn: Guardian


