Công nghệ

AI biến ảnh thành video nhảy múa

Các chuyên gia tại Đại học Công nghệ Nanyang (Singapore) và Microsoft giới thiệu mô hình AI mới có tên Disco, cho phép người dùng tạo video nhảy múa chỉ bằng một bức ảnh duy nhất.

Trước đây, một số ứng dụng hoán đổi khuôn mặt như Reface cũng gây sốt mạng xã hội khi cho phép người dùng tạo video chuyển động bằng một tấm ảnh chân dung. Tuy nhiên, ứng dụng này đơn giản là ghép mặt vào những video có sẵn.

Trong khi đó, mô hình AI Disco tạo cảm giác chân thật khi cho phép người dùng giữ lại cả tiền cảnh và nền của ảnh. AI cũng có thể học theo một vũ đạo mới và tái hiện thành hành động của người dùng. Ngoài ra, người dùng có thể tùy chọn nhiều vũ đạo từ những video khác nhau, chọn bối cảnh từ nguồn khác để sáng tạo.

Cách mô hình Disco học theo các động tác của người nhảy. Nguồn: Disco

Cách mô hình Disco học theo động tác của người nhảy. Nguồn: Disco

Để biến ảnh thành video nhảy múa bất kỳ, người dùng cần tải lên video có điệu nhảy gốc. AI sẽ phân tích và tái hiện các động tác. Sau đó, người dùng chọn ảnh cá nhân với tỷ lệ cơ thể gần bằng người mẫu trong video gốc. Disco sẽ tách nền, tách chi tiết trên cơ thể như tay chân, đầu, khuôn mặt rồi khớp với các động tác được hệ thống phân tích trước đó.

Nhóm đào tạo Disco cho biết họ dùng khoảng 700.000 ảnh chụp từ TikTok để dạy AI học các tư thế nhảy và tách người khỏi hậu cảnh. Sau đó, các nhà nghiên cứu tiếp tục tải lên 350 video nhảy múa, mỗi video dài 10-15 giây để AI học sâu hơn về cách con người chuyển động.

Các bước AI biến hình ảnh thành video nhảy múa. Nguồn: Disco

Theo Petapixel, Disco cho phép người dùng thực hiện mọi vũ đạo phổ biến trên TikTok mà không phải tốn công học và bắt chước.

"Với Disco, bạn có thể sáng tác bất kỳ thứ gì. Nếu muốn Elon Musk nhảy, bạn chỉ cần đưa hình ông vào hệ thống", tiến sĩ Tan Wang của Đại học Công nghệ Nanyang nói với New Scientist.

Trong khi đó, BGR nhận định công nghệ Disco có thể giúp người dùng TikTok "bắt trend" lập tức, nhưng cũng có thể khiến nội dung deepfake tràn lan mạng xã hội.

Không chỉ phục vụ người dùng mạng xã hội, Disco cũng được dùng trong hậu kỳ phim ảnh, chương trình truyền hình. Các nhà sản xuất có thể giúp diễn viên của họ khiêu vũ một cách tự nhiên mà không cần đến người đóng thế.

Các tin khác

VNPAY-POS tối ưu quản lý bán hàng doanh nghiệp

VNPAY-POS tối ưu quản lý bán hàng doanh nghiệp

Giải pháp tích hợp nhiều tính năng trên một thiết bị SmartPOS, hỗ trợ thanh toán các loại thẻ, quản lý thanh toán, kết toán tự động, kết nối hệ thống, in hóa đơn...
Nhân viên X tìm diệt "tàn dư" Twitter

Nhân viên X tìm diệt "tàn dư" Twitter

Nhân viên X tìm cách xóa những dấu vết còn lại của Twitter bằng cách sơn đen văn phòng, loại bỏ logo chim xanh và khoe "thành tích" lên mạng.
Lý do nhà mạng cắt gói cước giá rẻ

Lý do nhà mạng cắt gói cước giá rẻ

Ba nhà mạng lớn ngừng cung cấp một số gói cước giá rẻ và "data không giới hạn" nhằm hạn chế sim rác và tránh bị hiểu lầm về chất lượng mạng.
Elon Musk loay hoay với logo X

Elon Musk loay hoay với logo X

Logo X liên tục được tinh chỉnh và Musk cho biết bản hiện tại chưa phải cuối cùng, ngoài ra ông cũng "giành" tài khoản @x của một người dùng.
Facebook vượt ba tỷ người dùng

Facebook vượt ba tỷ người dùng

Lượng người dùng hoạt động hàng tháng của Facebook đạt 3,03 tỷ người, tương đương hơn một phần ba dân số thế giới.
Tôi có nên đi học prompt AI?

Tôi có nên đi học prompt AI?

Tôi thấy nhiều công ty trả lương hậu hĩnh cho kỹ sư prompt, tôi cũng muốn đi học nhưng không biết bắt đầu từ đâu?
Kỹ sư prompt - nghề ra lệnh cho siêu AI

Kỹ sư prompt - nghề ra lệnh cho siêu AI

Thay vì ngồi nói chuyện phiếm với ChatGPT hay Midjourney, Khánh Nguyễn tạo ra các câu lệnh văn bản (prompt) để AI có thể cho ra kết quả đúng ý.
Ứng dụng ChatGPT có mặt trên Android

Ứng dụng ChatGPT có mặt trên Android

Ứng dụng ChatGPT bắt đầu được đưa lên nền tảng Android từ 25/7, nhưng chỉ người dùng ở một số khu vực có thể sử dụng.