Công nghệ

AI của NVIDIA "xem YouTube" để học chơi điện tử: đã chơi được 1.000 game nhưng vẫn yếu kém ở vài trò

Trong một bước tiến đáng chú ý của ngành trí tuệ nhân tạo (AI), đội ngũ nghiên cứu từ NVIDIA cùng các cộng tác viên tại đại học Stanford và Caltech đã chính thức công bố NitroGen - mô hình thống nhất từ thị giác đến hành động (vision-to-action) được thiết kế để chơi trò chơi điện tử trực tiếp từ các khung hình thô.

Hay nói cách khác, NitroGen là một hệ thống AI có thể chơi điện tử. Toàn bộ bộ dữ liệu, công cụ đánh giá, trọng số mô hình và mã nguồn đều được công khai trên Hugging Face .

AI của NVIDIA học chơi game từ YouTube , thành công vượt bậc với NitroGen - Ảnh 1.

Khác với các phương pháp huấn luyện truyền thống thường dựa vào hệ thống điểm thưởng, NitroGen được xây dựng dựa trên phương pháp học máy bắt chước quy mô lớn. Đội ngũ phát triển đã khai thác những thước phim chiếu gameplay đặc biệt để huấn luyện NitroGen: ngoài ghi lại cảnh vật và hành động của nhân vật trong game, những video này có thêm hình ảnh của một tay cầm chơi game, tại đây hiển thị thao tác của game thủ trong quá trình chơi.

AI của NVIDIA học chơi game từ YouTube , thành công vượt bậc với NitroGen - Ảnh 2.

Một video có "tay cầm ảo", giúp người xem biết người chơi đang bấm nút gì - Ảnh chụp màn hình.

Bằng kỹ thuật thị giác máy tính như SIFT và XFeat, hệ thống xác định chính xác vị trí của phiên bản “tay cầm ảo” này, lấy riêng phân vùng này để phân tích. Bằng mô hình phân đoạn SegFormer, họ đã trích xuất thành công các vị trí cần gạt và trạng thái nút bấm với độ chính xác cực cao để tạo thành bộ dữ liệu huấn luyện có nhãn.

Về mặt kỹ thuật, NitroGen thừa hưởng thành quả từ dự án robot GR00T của NVIDIA. Điều này giúp mô hình vượt xa khả năng của một bot chơi game thông thường, để tiến tới trở thành một tác nhân vạn năng (universal agent).

Tác nhân AI tự chơi game sau khi được huấn luyện thành công bằng video YouTube và Twitch - Video: NVIDIA.

Kết quả thực nghiệm cho thấy, khi đối mặt với những trò chơi hoàn toàn mới, chưa từng xuất hiện trong quá trình huấn luyện, NitroGen đạt tỷ lệ thành công cao hơn 52% so với các mô hình được đào tạo từ đầu. Khả năng này chứng minh rằng: việc mở rộng quy mô dữ liệu hình ảnh có thể tạo ra những năng lực đột biến tương tự như cách các mô hình ngôn ngữ lớn từng đạt được.

Hiện tại, NitroGen được tối ưu hóa tốt nhất cho các dòng game hành động, đua xe và đi bàn dạng 2D - những thể loại sử dụng bộ điều khiển tay cầm. Mặc dù NitroGen chưa chơi tốt được những dòng game “ưa” tay cầm và bàn phím như MOBA và RTS, sự ra đời của hệ thống AI này đã đặt nền móng quan trọng cho trí tuệ nhân tạo chơi game thế hệ mới và các hệ thống kiểm thử tự động.

NVIDIA đã quyết định công khai mã nguồn, trọng số mô hình và bộ dữ liệu để cộng đồng nghiên cứu có thể tiếp tục phát triển lĩnh vực tác nhân AI hóa đầy tiềm năng này.

Các tin khác

"TP HCM chấp nhận rủi ro để đồng hành cùng startup"

TP HCM sẽ hỗ trợ một phần kinh phí để startup hoàn thiện công nghệ, miễn trừ trách nhiệm nếu thất bại khách quan, tức chấp nhận rủi ro để đổi mới sáng tạo, theo Giám đốc Sở Khoa học và Công nghệ Lâm Đình Thắng.

Tận hưởng trọn vẹn mùa lễ hội cuối năm với lựa chọn chi tiêu thông minh

Mùa lễ hội cuối năm mang đến không khí rộn ràng của mua sắm, gặp gỡ và những chuyến đi nối tiếp nhau. Đây cũng là lúc những người tiêu dùng thông thái lên kế hoạch để chi tiêu hợp lý và “tận dụng” tối đa các ưu đãi từ các ngân hàng hay các thương hiệu, cho trải nghiệm mua sắm trong giai đoạn cao điểm thêm trọn vẹn.

Tiết lộ lý do tài sản Elon Musk nhanh chóng vượt mốc 700 tỷ USD, giàu nhất lịch sử nhân loại

Elon Musk vừa trở thành người đầu tiên trong lịch sử sở hữu khối tài sản vượt 700 tỷ USD, sau khi Tòa án Tối cao bang Delaware đảo ngược phán quyết trước đó liên quan đến gói thù lao cổ phiếu tại Tesla. Quyết định pháp lý này không chỉ thay đổi vị trí của Musk trên bảng xếp hạng giàu có toàn cầu, mà còn mở ra viễn cảnh về tỷ phú nghìn tỷ USD đầu tiên trên thế giới.