Công nghệ

AI tạo video từ văn bản của Trung Quốc đối đầu Sora

Kuaishou, nền tảng chia sẻ video ngắn có quy mô lớn thứ hai Trung Quốc, hôm 6/6 ra AI tạo video từ văn bản mang tên Kling sở hữu nhiều tính năng nổi bật như cải thiện chất lượng chuyển động, bám sát nội dung mô tả và có thể tạo chuỗi khung hình khác nhau.

Kuaishou cho biết Kling có thể tạo video dài 2 phút với độ phân giải 1080p và 30 khung hình mỗi giây chỉ bằng một đoạn mô tả, đồng thời mô phỏng chính xác các hiệu ứng vật lý như thế giới thực, điều mà phần lớn mô hình AI vẫn chưa làm được.

Video được Kling tạo từ một dòng mô tả. Video: Twitter/bdsqlsz

Ngoài khả năng tạo sinh, Kling còn có thể xây dựng khuôn mặt và cơ thể 3D nhằm cải thiện cử động và biểu cảm của nhân vật trong video.

Một trong những điều gây ấn tượng của Kling là hình ảnh giống đời thực. Một số video vẫn xuất hiện tình trạng mờ ảo thường thấy trong hình ảnh do AI tạo, nhưng mức độ nhỏ hơn rất nhiều.

Khác với Sora của OpenAI, người dùng đã có thể tiếp cận và sử dụng Kling. Tuy nhiên, chưa rõ các mô hình AI hiện đại như Kling và Vidu có thể được phát hành ngoài Trung Quốc hay không.

Trước đó, giữa tháng 2, OpenAI công bố công cụ tạo video Sora. Với sự nổi tiếng của công ty mẹ cùng khả năng "thấu hiểu sâu sắc ngôn ngữ" của mô hình, nhiều người dùng tỏ ra phấn khích với Sora. Các clip minh họa cho thấy mô hình này có thể tạo ra "những nhân vật có khả năng thể hiện cảm xúc sinh động", theo Analyticsindiamag. Độ chân thực của các sản phẩm từ Sora cũng là chủ đề bàn luận trên nhiều hội nhóm mạng xã hội. Một số người cho rằng công cụ AI này thực sự sẽ thay đổi cuộc chơi trên trên thị trường.

(Theo Tom's Guide)

Cùng chuyên mục

Đọc thêm