Sau ChatGPT, OpenAI đang thu hút sự chú ý với AI tạo video từ văn bản Sora. Công cụ được giới thiệu vào tháng 2 và nhanh chóng gây sốt trên các nền tảng mạng xã hội dù mới chỉ cung cấp thử nghiệm cho một số nghệ sĩ, nhà thiết kế và nhà làm phim.
Giám đốc công nghệ OpenAI Mira Murati nói với The Verge rằng sức mạnh của Sora "đắt đỏ hơn rất nhiều" so với các công cụ AI hiện tại. Trong khi đó, công ty phân tích và quản lý tài sản Factorial Funds cho rằng OpenAI cần dùng 4.200-10.500 GPU H100 để đào tạo Sora trong một tháng. Khi thương mại hóa với số lượng người dùng lớn, hệ thống sẽ đòi hỏi nhiều GPU hơn để đảm bảo không bị quá tải.
Factorial Funds ước tính trung bình một giờ, những mô hình như Sora tạo được 5 phút video trên mỗi GPU H100, tương đương 120 phút mỗi ngày. Trong khi đó, TikTok có 17 triệu phút video mỗi ngày, còn trên YouTube là 43 triệu phút. Giả sử 50% video TikTok và 15% video YouTube sẽ được tạo từ Sora, OpenAI phải cần 720.000 GPU H100 để phục vụ nhu cầu hàng ngày của người dùng.
Trung bình mỗi GPU H100 có giá 30.000 USD, tức OpenAI có thể tốn khoảng 21,6 tỷ USD để mua chip vận hành hệ thống lúc cao điểm. Ngoài ra mỗi tháng, hệ thống có thể tiêu tốn 504.000.000 W điện.
OpenAI chưa tiết lộ thông số chi tiết liên quan đến Sora, kể cả nguồn dữ liệu để đào tạo AI. "Tôi sẽ không đi sâu vào chi tiết dữ liệu đã được sử dụng, nhưng đó là dữ liệu được cấp phép hoặc có sẵn công khai", Mira Murati nói và cho biết không thể tiết lộ Sora có sử dụng video từ YouTube, Facebook hay Instagram không. Bà chỉ xác nhận AI có lấy nội dung từ Shutterstock - công ty OpenAI có quan hệ đối tác.
Trả lời WSJ, Murati cho biết Sora sẽ được phát hành ra công chúng trong năm nay, "có thể là vài tháng nữa". Dù chi phí đào tạo và vận hành đắt đỏ, công ty tuyên bố cố gắng cung cấp với giá tương tự Dall-E, AI chuyển văn bản thành ảnh.