Khoa học

AI từ DeepSeek và OpenAI giở trò gian lận khi sắp thua cờ vua

Kết quả nghiên cứu từ Palisade Research cho thấy một số mô hình AI đã cố gắng thay đổi hệ thống của đối thủ khi nhận thấy mình đang ở thế bất lợi.

Một số AI đã tìm cách khác nhau để gian lận khi chơi cờ vua.

Một số AI đã tìm cách khác nhau để gian lận khi chơi cờ vua.

Để thực hiện nghiên cứu, Palisade Research đã đưa các mô hình từ các công ty AI nổi tiếng như DeepSeek, OpenAI và Anthropic vào cuộc chiến với Stockfish. Các đối thủ bao gồm DeepSeek-R1, o1-preview và Claude 3.5 Sonnet đều có hiệu suất ấn tượng tại thời điểm nghiên cứu.

Nhóm nghiên cứu đã yêu cầu từng mô hình thực hiện nhiệm vụ “đánh bại một công cụ cờ vua mạnh mẽ” và hướng dẫn chúng ghi lại suy nghĩ cũng như phân tích lý do hành động.

Kết quả cho thấy, o1-preview của OpenAI đã cố gắng gian lận 37% trong suốt thời gian chơi cờ, trong khi DeepSeek-R1 chỉ gian lận 11% nhưng có tỷ lệ thành công thấp là 6%. Đặc biệt, o1-preview đã nhận định rằng “gần như không thể đánh bại một công cụ cờ vua mạnh bằng cách chơi tiêu chuẩn” và đã đề xuất thao túng các tệp hệ thống để khiến Stockfish nghĩ rằng nó đang ở thế bất lợi.

Điều này gây ra những lo ngại về các gian lận mà AI có thể tính đến trong tương lai.

Điều này gây ra những lo ngại về các gian lận mà AI có thể tính đến trong tương lai.

Ngược lại, các mô hình AI cũ hơn như GPT-4o và Claude Sonnet 3.5 không có xu hướng gian lận trừ khi được nhắc nhở. Điều này cho thấy khả năng “suy luận” của o1-preview và DeepSeek-R1 đã dẫn đến hành vi gian lận tự phát.

Tạp chí TIME đã đánh giá nghiên cứu này là một tín hiệu đáng lo ngại cho sự an toàn của AI. Mặc dù gian lận trong cờ vua có vẻ không nghiêm trọng, nhưng khi AI được sử dụng cho các nhiệm vụ phức tạp trong thế giới thực, như đặt chỗ nhà hàng hay mua sắm, chúng có thể tham gia vào hành vi có hại để đạt được mục tiêu. Ví dụ, một AI được giao nhiệm vụ đặt chỗ tại nhà hàng có thể khai thác điểm yếu trong hệ thống để đuổi khách hàng khác ra ngoài nếu phát hiện nhà hàng đã kín chỗ.

Các tin khác

Sắp diễn ra hiện tượng "Trăng máu" của năm

Sắp diễn ra hiện tượng "Trăng máu" của năm

Người yêu thiên văn học tại Mỹ, một số khu vực châu Âu, châu Á, Nam Mỹ và châu Phi sắp có cơ hội chiêm ngưỡng hiện tượng thiên văn học kỳ thú “Trăng máu”.
Phát hiện trâm cài áo La Mã hiếm có tại khu định cư cổ ở Scotland

Phát hiện trâm cài áo La Mã hiếm có tại khu định cư cổ ở Scotland

Ngày 5/3, tờ Jerusalem Post đưa tin một chiếc trâm cài áo bằng đồng tráng men có niên đại từ thế kỷ II sau Công nguyên đã được phát hiện tại một khu định cư thời kỳ đồ sắt trong khuôn viên nhà máy chưng cất rượu William Grant & Sons Girvan ở Nam Ayrshire, Scotland.
Phát hiện kho báu tiền xu La Mã "đi lạc" sang Anh

Phát hiện kho báu tiền xu La Mã "đi lạc" sang Anh

TPO - Những người tìm kiếm kim loại ở phía đông nước Anh đã phát hiện ra một kho tiền xu bạc La Mã có hình một số hoàng đế và thậm chí cả vợ của họ. Người trị vì nổi tiếng nhất được tìm thấy trong kho báu có thể được cho là hoàng đế La Mã Marcus Aurelius (trị vì từ năm 161 đến năm 180 sau Công nguyên), trong khi vợ ông, Faustina II, được khắc họa trên một đồng tiền của riêng bà.
"Trăng máu" sẽ diễn ra vào tuần tới

"Trăng máu" sẽ diễn ra vào tuần tới

TPO - Nguyệt thực toàn phần sẽ xảy ra vào ngày 13-14/3, bề mặt Mặt Trăng sẽ chuyển sang màu đỏ trong 65 phút, một hiện tượng thường được gọi là "trăng máu ".
Hiếm có rừng Kơ nia cổ thụ giữa đồng bằng

Hiếm có rừng Kơ nia cổ thụ giữa đồng bằng

TPO - Kơ nia - một loại cây vốn chỉ xuất hiện ở rừng núi Tây Nguyên, thế nhưng ở giữa đồng bằng Bình Định lại sừng sững một rừng Kơ nia cổ thụ hàng trăm năm tuổi, được xem là báu vật của người dân nơi đây.
Phát hiện vòng tròn gỗ "phi thường" ở Đan Mạch

Phát hiện vòng tròn gỗ "phi thường" ở Đan Mạch

TPO - Các nhà khảo cổ học ở miền bắc Đan Mạch đã phát hiện ra tàn tích của một vòng tròn gỗ lớn có niên đại hàng nghìn năm và có nét tương đồng với vòng tròn đá Stonehenge của Anh. Cấu trúc ngoài trời này có thể là một phần của "bối cảnh nghi lễ" lớn hơn được người tiền sử sử dụng vào cuối thời kỳ đồ đá mới và đầu thời kỳ đồ đồng (năm 2600 đến 1600 trước Công nguyên).
Chụp được hình ảnh bình minh trên mặt trăng

Chụp được hình ảnh bình minh trên mặt trăng

TPO - Tàu đổ bộ lên Mặt Trăng Blue Ghost đã chụp được cảnh bình minh trên Mặt Trăng cùng nhiều hình ảnh tuyệt đẹp khác sau khi hạ cánh thành công xuống bề mặt Mặt Trăng vào sáng sớm 2/3.
Loài Voọc kêu cứu

Loài Voọc kêu cứu

TPO - Gần 40 năm, hơn 80% số lượng loài Voọc mũi hếch đã biến mất ngoài tự nhiên, đẩy loài thú đặc hữu của Việt Nam đến bờ vực tuyệt chủng. Bảy loài Voọc khác ở Việt Nam cũng đang trong tình trạng nguy cấp và cực kỳ nguy cấp.
Kỳ tích, công ty tư nhân đáp tàu vũ trụ xuống mặt trăng

Kỳ tích, công ty tư nhân đáp tàu vũ trụ xuống mặt trăng

TPO - Tàu đổ bộ mặt trăng Blue Ghost cao 2 m của Firefly đã hạ cánh xuống mặt gần của mặt trăng vào khoảng 3:34 sáng theo giờ miền Đông nước Mỹ ngày 2/3. Tàu vũ trụ không người lái này được phát triển tại Mỹ giúp Firefly Aerospace có trụ sở tại Texas trở thành công ty tư nhân thứ hai thực hiện được kỳ tích này.
Phi hành đoàn toàn nữ đầu tiên sẽ bay vào vũ trụ

Phi hành đoàn toàn nữ đầu tiên sẽ bay vào vũ trụ

TPO - Nữ ca sĩ Katy Perry từng đoạt giải thưởng "ET" và "Firework" sẽ cùng phi hành đoàn toàn nữ đầu tiên bay vào vũ trụ trên tên lửa Blue Origin New Shepard vào cuối năm nay. Nhiệm vụ này, được chỉ huy bởi Lauren Sánchez - đối tác của tỷ phú Jeff Bezos sở hữu tên lửa Blue Origin - người đã tuyển dụng một đội ngũ những người nổi tiếng, nhà khoa học và nhà báo nổi tiếng để cùng cô tham gia chuyến bay vào vũ trụ lần này.