Theo TechSpot, một nhóm nghiên cứu thuộc Đại học Carnegie Mellon (Mỹ) vừa giới thiệu LegoGPT, công cụ trí tuệ nhân tạo (AI) có khả năng chuyển văn bản thành mô hình Lego hợp lệ và ổn định. Công trình nghiên cứu này đã được công bố công khai trên GitHub, cho phép cộng đồng tiếp cận miễn phí bộ dữ liệu, mã nguồn và mô hình.
LegoGPT được huấn luyện trên tập dữ liệu gồm hơn 47.000 cấu trúc Lego, tương ứng với 28.000 mô hình 3D như bàn, ghế, xe hơi, tàu thủy, nhạc cụ và nhiều vật thể khác. Quá trình huấn luyện sử dụng phương pháp dự đoán tuần tự, giúp AI xác định viên gạch tiếp theo cần lắp để hoàn thiện thiết kế. Mỗi bước đều được kiểm tra tính hợp lệ, đảm bảo không có lỗi chồng lắp hay viên gạch "lơ lửng" trong không gian. Khi phát hiện thiết kế không ổn định, AI sẽ quay lại trạng thái trước đó và tiếp tục hoàn thiện mô hình.

Minh họa quá trình so sánh khả năng tạo mô hình Lego từ văn bản của LegoGPT và các AI khác
ẢNH: CHỤP MÀN HÌNH TECHSPOT
Để xây dựng bộ dữ liệu mang tên StableText2Lego, nhóm nghiên cứu đã chuyển các mô tả văn bản thành mô hình lưới 3D từ bộ ShapeNetCore. Những mô hình này được đưa vào lưới voxel 20 x 20 x 20 để xác định bố cục ban đầu. Sau khi loại bỏ các thiết kế kém ổn định, hệ thống tiếp tục tạo ra nhiều góc nhìn khác nhau và sử dụng GPT-4o để mô tả lại bằng văn bản. Quá trình này giúp mô hình hiểu mối liên hệ giữa ngôn ngữ tự nhiên và cấu trúc vật lý.
LegoGPT hoạt động bằng cách chuyển mô tả văn bản thành chuỗi các viên gạch Lego, được sắp xếp từ dưới lên trên. Công nghệ dự đoán theo chuỗi cho phép mô hình AI kiểm tra từng viên gạch về mặt hình học và tính ổn định. Kết quả cuối cùng là một mô hình hoàn chỉnh, có thể lắp ráp bằng tay hoặc bằng robot.
Ngoài ra, LegoGPT còn có thể kết hợp với các công nghệ thị giác máy tính. Người dùng có thể chụp ảnh bộ Lego đang sở hữu và để AI đề xuất các thiết kế phù hợp với số lượng và chủng loại gạch sẵn có. Tính năng này mở ra tiềm năng phát triển các ứng dụng tương tác thực tế, giúp cá nhân hóa trải nghiệm chơi Lego.
Hiện tại, toàn bộ mã nguồn và dữ liệu của LegoGPT đã được công bố trên GitHub, cho phép các nhà phát triển tiếp tục nghiên cứu hoặc xây dựng các ứng dụng thương mại. Một hướng phát triển tiềm năng là xây dựng nền tảng cho phép người dùng tự tạo và tải xuống thiết kế Lego tùy chỉnh, mở rộng khả năng sáng tạo cho cộng đồng yêu thích LEGO trên toàn cầu.