Theo TechSpot, trí tuệ nhân tạo (AI) đang chuyển hướng sang học hỏi từ hành vi thực tế của con người để cải thiện khả năng vận hành của robot trong môi trường vật lý. Những động tác đơn giản hằng ngày như gập khăn, cầm nắm vật thể hay sắp xếp đồ vật đang trở thành nguồn dữ liệu chiến lược trong cuộc đua phát triển robot thông minh và linh hoạt hơn.

Robot học thao tác nấu ăn từ dữ liệu hành vi con người, ghi lại qua thiết bị đeo thông minh trong môi trường thực tế
ẢNH: CHỤP MÀN HÌNH NVIDIA
Tại thành phố Karur, Ấn Độ, hàng trăm công nhân được trang bị camera GoPro để ghi lại từng thao tác tay khi làm việc. Video từ góc nhìn người thật này được gửi tới Objectways, công ty chuyên gán nhãn dữ liệu cho các hệ thống robot và AI. Mỗi chuyển động đều được phân tích kỹ lưỡng, từ cách các ngón tay di chuyển đến lực tác động phù hợp để hoàn thành công việc như gập khăn mà không để lại nếp nhăn.
Dữ liệu này giúp xây dựng các bộ huấn luyện cho thuật toán máy học (machine learning), cho phép robot học cách tái tạo hành vi con người một cách chính xác. Không giống như mô hình ngôn ngữ lớn dựa vào văn bản, robot cần dữ liệu hình ảnh và chuyển động từ góc nhìn thứ nhất để học cách thao tác trong thế giới vật lý.
Các công ty như Tesla, Boston Dynamics, Nvidia, Google và OpenAI đang đầu tư mạnh vào việc thu thập và xử lý loại dữ liệu này. Encord - nền tảng tại San Francisco (Mỹ) chuyên điều phối các dự án gán nhãn - cho biết robot đang bước vào giai đoạn phát triển mạnh nhờ các bộ dữ liệu trình diễn chất lượng cao. Họ hợp tác với Objectways để cung cấp dữ liệu cho các khách hàng như Physical Intelligence và Dyna Robotics.

Robot hình người của Tesla đang thực hiện thao tác phân loại vật thể trong môi trường sản xuất, dựa trên dữ liệu hành vi con người đã được huấn luyện trước đó
ẢNH: TESLA
Cùng lúc, nhiều công ty triển khai mô hình "điều khiển từ xa", nơi robot được hướng dẫn bởi con người qua joystick từ các trung tâm huấn luyện tại Đông Âu. Những chuyển động được ghi lại, phân tích và dùng để điều chỉnh thuật toán cho robot học cách thực hiện độc lập.
Figure AI, với trụ sở tại San Jose (Mỹ), đã hợp tác cùng Brookfield để ghi hình hoạt động trong 100.000 căn hộ, thu thập dữ liệu với khoản đầu tư lên đến 1 tỉ USD. Trong khi đó, Scale AI - được Meta hậu thuẫn, đã thu thập hơn 100.000 giờ video phục vụ huấn luyện robot.
Dữ liệu hành vi con người không còn chỉ là công cụ nghiên cứu mà đã trở thành tài sản chiến lược giúp robot tiến gần hơn tới khả năng làm việc thay con người. Theo các chuyên gia, chính độ chính xác và tính chân thực của dữ liệu đời sống đang quyết định tốc độ thương mại hóa của robot trong thập kỷ tới.














