Công nghệ

AI chuyển văn bản thành video trong vài giây

Ngày 20/3, Runway, công ty AI có trụ sở tại New York, giới thiệu công cụ Gen-2, cho phép tạo video từ ảnh tĩnh hoặc văn bản đầu vào. Chẳng hạn, khi nhập "một con mèo đi dưới mưa", AI sẽ đưa ra một video ba giây với nội dung như yêu cầu.

Đoạn video được AI tạo từ mô tả "một người đi bộ băng qua rừng rậm". Ảnh: Runway

Runway ra đời năm 2018, là startup nổi tiếng về AI không kém OpenAI và có 45 nhân viên toàn thời gian. Công ty đang cung cấp website hỗ trợ người dùng chỉnh sửa video nhanh, như xóa phông hay thêm hiệu ứng. Họ nằm trong nhóm đứng sau phiên bản gốc của Stable Diffusion - AI chuyển văn bản thành ảnh và sau này được công ty Stability AI phát triển thêm.

Tháng 2/2019, Runway công bố mô hình chỉnh sửa video có tên Gen-1. Công cụ này tập trung vào chuyển đổi cảnh quay video có sẵn, nhập hoạt cảnh 3D thô hoặc thêm bộ lọc do AI tạo. Gen-2 vẫn dựa trên kiến trúc của Gen-1, nhưng tập trung nhiều hơn vào việc khởi tạo video bằng văn bản, ảnh đầu vào hoặc kết hợp cả hai.

Bản demo được Cris Valenzuela, nhà đồng sáng lập kiêm CEO Runway, trình diễn cho thấy, Gen-2 có thể tạo được cảnh quay "drone trên bầu trời sa mạc" hay "cận cảnh mắt của con người" trong vài giây. Tuy nhiên, độ phân giải và tính chân thực vẫn bị hạn chế, cũng như chưa có âm thanh.

"Bạn có thể tạo video về cuộc rượt đuổi gay cấn bằng ôtô, nhưng đôi khi, những chiếc ôtô có thể bay đi", Valenzuela nói về Gen-2.

Video được Gen-2 tạo từ mô tả "cảnh núi non nhìn từ trên không".

"Hoàng hôn qua cửa sổ trong một căn hộ ở New York". Video: Runway

Valenzuela khẳng định nếu yêu cầu đầu vào càng chi tiết, nội dung được Gen-2 tạo ra càng sống động, tương tự AI tạo ảnh từ văn bản như Dall-E hay Stable Diffusion. Trong tương lai, công cụ sẽ được cải tiến để giúp nghệ sĩ, nhà thiết kế và nhà làm phim biến các ý tưởng thành video nhanh hơn với chi phí thấp.

Giáo sư Hany Farid tại Đại học California đánh giá video do Gen-2 tạo ra "siêu tuyệt vời". Ông dự đoán video chất lượng cao hơn từ công nghệ này chỉ là vấn đề thời gian.

Tuy nhiên, ông lo ngại Gen-2 có thể trở thành công nghệ dễ bị lạm dụng và có thể nguy hiểm hơn cả deepfake. Chẳng hạn, kẻ xấu có thể cho ra đời video giả mạo để lan truyền tin giả, lừa đảo...

Theo The Verge, Runway đang mở ra cuộc đua mới cho mô hình AI tổng quát, nơi khả năng sáng tạo không giới hạn, bất kể nội dung là văn bản, hình ảnh hay video. Dù vậy, trang công nghệ này cũng lo ngại chúng sẽ bị lợi dụng trong các nội dung tinh vi khiến người dùng tin tưởng lập tức, bất kể đúng hay sai.

Gen-2 hiện bị hạn chế quyền truy cập, người dùng cần đăng ký và chờ đợi. Theo người phát ngôn Kelsey Rondenet của Runway, người dùng sẽ được cấp quyền truy cập rộng rãi trong những tuần tới.

(theo Bloomberg, The Verge)

Các tin khác

Google cho dùng thử Bard AI

Người dùng có thể đăng ký trải nghiệm Bard, công cụ chatbot AI được Google công bố tháng trước để đối đầu với ChatGPT.

Nuôi cua lột bằng AI

Hee Kee Fried Crab, nhà hàng cua nổi tiếng Hong Kong, đã sử dụng AI để theo dõi tỷ lệ cua chết và các thuộc tính sức khỏe của cua.

Cao tốc Vĩnh Hảo - Phan Thiết sắp xong vẫn "mòn mỏi" chờ đất đắp nền

Cao tốc Vĩnh Hảo - Phan Thiết có thể hoàn thành đưa vào khai thác được ngay, nhưng thiếu đất đắp nền đường, nhà thầu và cả dự án phải nằm chờ chỉ vì thủ tục gia hạn khai thác mỏ. Phát sinh này khiến dự án cao tốc nguy cơ không kịp tiến độ hoàn thành, đưa vào khai thác trước 30/4 tới.

Bí mật của người đàn ông 90 tuổi có vẻ ngoài như trẻ hơn 20 tuổi: Chăm tập thử thách “chim hồng hạc”, skincare bài bản

Dù đã 90 tuổi nhưng cụ ông Robert Eddison vẫn làm không ít người ngạc nhiên vì sở hữu vẻ ngoài như ở tuổi 70. Thực chất, đằng sau vẻ ngoài trẻ trung và khỏe mạnh hơn tuổi của cụ ông này là rất nhiều phương pháp “níu giữ thanh xuân”.

Google cho dùng thử Bard AI

Người dùng có thể đăng ký trải nghiệm Bard, công cụ chatbot AI được Google công bố tháng trước để đối đầu với ChatGPT.

Ông Trần Đình Long tâm sự về "cơn lốc xoáy" thua lỗ 2 quý, Hòa Phát tiết lộ sẽ có 10 khu công nghiệp trong 10 năm tới, tập trung phát triển các đại đô thị 300-500ha

“Trong cùng một năm mà ngành bất động sản từ nóng chuyển sang nguội dần và đóng băng vào cuối năm. Tỷ giá, lãi suất cũng lên cơn sốt chưa từng có và chỉ hạ nhiệt bớt vào tháng 12/2022.” – ông Long chia sẻ

Có công trình tiện ích nào trong KĐT chữa lành của Đặng Lê Nguyên Vũ giá chục tỷ đồng/căn vẫn nườm nượp người mua? Một địa điểm được cả báo Mỹ hết lời ca ngợi

Không phải ngẫu nhiên Thành phố Cà phê của ông Đặng Lê Nguyên Vũ được ví như dự án vàng tại thủ phủ nông sản tỉ đô của Tây Nguyên. Ngay khi chào bán, 99% căn hộ đã được giao dịch thành công chỉ trong 80 phút đầu.