"Trong 6 tháng trải nghiệm nhiều mô hình chuyển văn bản thành video, gồm Sora, tôi nhận ra chúng gặp khó khăn với chuyển động vật lý phức tạp, như thể dục dụng cụ", nhà phát triển Deedy Das nói với Ars Technica. "Các video tập thể dục dụng cụ tạo bằng AI hiện trở thành thước đo cho mức độ thành công của chúng".
Trên X, người này cũng chia sẻ một số video ghi lại cảnh chuyển động nhanh do Sora tạo ra, như các pha nhào lộn, chạy, nhảy. Nhiều khung cảnh bị tách làm hai, chuyển động "thiếu tự nhiên đến mức vô lý", xuất hiện tay chân giả không đúng thực tế.
Theo Deedy Das, cảnh chuyển động nhanh do các mô hình AI như Sora tạo ra đã cải thiện nhiều so với 6 tháng trước, nhưng vẫn chưa thể cho ra sản phẩm chất lượng như video tiết tấu chậm. "Nhìn chung, dù đã cải tiến, mọi thứ vẫn rất kinh hoàng", nhà phát triển này nhận xét. "Hy vọng các công cụ AI tạo video sẽ 'học vật lý' để tạo cảnh thật hơn, nhưng điều đó vẫn chưa xảy ra".
Sau video của Deedy Das, một số người dùng X cũng cho rằng chuyển động nhanh là điểm yếu của công cụ này. "Xem ra Sora vẫn phải vật lộn với kiến thức vật lý cơ bản, cho thấy việc mô phỏng thực tế đòi hỏi AI phải thực sự hiểu nó trước", một người bình luận.
"Tôi phát hiện 'lẽ thường' trong cuộc sống không dễ tái tạo trong môi trường số, thậm chí là một trong những điều khó mã hóa nhất", một người khác viết.
Sora được OpenAI ra mắt tháng 2, giới hạn cho một nhóm nhỏ dùng thử trước khi công bố đại trà ngày 9/12 cho người dùng ChatGPT Plus và Pro. Mô hình giúp tạo video tối đa một phút bằng câu lệnh mô tả. Tháng trước, một nhóm nghệ sĩ trải nghiệm sớm phát tán công cụ này sau khi bất mãn và tố cáo OpenAI lợi dụng họ.
Công cụ cũng được cho là gặp một số rắc rối về bản quyền. Hồi giữa năm, khi WSJ hỏi nguồn dữ liệu đào tạo Sora có lấy từ YouTube không, cựu CTO Mira Murati không đưa ra câu trả lời rõ ràng. Business Insider dẫn lời CEO YouTube sau đó nói rằng đây thực sự là vấn đề lớn và OpenAI không nên dùng video của họ để đào tạo mô hình AI.