Công nghệ

Giải mã Sora - AI tạo video gây sốt của OpenAI

Sora của OpenAI được giới chuyên gia đánh giá là công cụ AI tạo sinh cho ra những thước phim chất lượng tốt nhất hiện nay. "Sora đánh dấu bước nhảy vọt trong lĩnh vực chuyển văn bản thành video", ABC News đánh giá.

Trong khi đó, Time cho biết trước khi Sora xuất hiện, thế giới đã có những mô hình AI làm video như Runway, Pika. Tuy nhiên, điểm yếu của chúng là chất lượng video còn tệ và thời gian ngắn. Trong khi đó, Sora có thể tạo video dài 60 giây với bối cảnh phức tạp nhưng vẫn đảm bảo độ mượt mà, logic, dù vẫn còn một số lỗi.

Video được Sora tạo từ văn bản: Đàn máy bay giấy bay qua rừng rậm, len lỏi quanh những tán cây như thể chúng đang di cư. Nguồn: OpenAI

Đột phá của OpenAI

OpenAI chưa công khai mô hình tạo video từ văn bản của mình với công chúng. Trong phần mô tả, công ty cũng đề cập rất ít về công nghệ phía sau và nguồn dữ liệu dùng để đào tạo.

"Sora sử dụng mô hình khuếch tán, tạo video bằng cách bắt đầu với một video nhiễu, độ phân giải thấp sau đó loại bỏ nhiễu qua nhiều bước cho đến khi đầu ra đạt kết quả ưng ý", công ty đứng sau ChatGPT nói về cách thức hoạt động của Sora. Nhờ vậy, AI này có khả năng tạo toàn bộ video cùng lúc thay vì từng đoạn ngắn và ghép lại như các công cụ khác. Thuật toán cho phép mô hình dự đoán nhiều khung hình cùng lúc để đảm bảo chủ thể giữ nguyên vẹn trong khi các chi tiết khác được tái hiện.

Mô phỏng cách Sora tạo ra video bằng cách loại bỏ độ nhiễu bằng thuật toán. Nguồn: Medium

Mô phỏng cách Sora tạo ra video bằng việc loại bỏ độ nhiễu thông qua thuật toán. Nguồn: Medium

Theo OpenAI, Sora được xây dựng dựa trên những nghiên cứu trước đây về AI tạo ảnh Dall-E và tạo văn bản ChatGPT. Tuy nhiên, tiến sĩ Jim Fan, nhà nghiên cứu cấp cao về AI tại Nvidia, nhận định: "Nếu bạn vẫn cho rằng Sora chỉ là món đồ chơi sáng tạo như Dall-E, hãy nghĩ lại. Nó là mô hình vật lý học hệ thống dựa trên dữ liệu, có thể mô phỏng cả thế giới thực lẫn ảo".

Ông lưu ý Sora là mô hình biến áp khuếch tán từ đầu đến cuối. Bí mật của nó nằm ở khả năng hiểu sâu sắc văn bản trước khi chuyển đổi thành các dạng hình ảnh 3D. Từ đây, mô hình tiếp tục đưa ra dự đoán dựa trên quy tắc chuyển động vật lý để biến đổi từng pixel cho video đến mức chính xác nhất có thể.

"Trình mô phỏng của Sora không chỉ dựa trên những dữ liệu được học, nó còn có thể tự đào tạo, tìm ra kết quả đúng nhất để tiếp tục sáng tác", Fan phân tích. Ông cho rằng điều khiến Sora trở nên khác biệt là nó không tạo video bằng cách lắp ghép chuỗi hình ảnh rời rạc mà kết xuất tập hợp pixel theo thời gian thực.

Sora đưa ra 5 video cùng lúc dựa trên yêu cầu mô tả khung cảnh với 5 góc nhìn. Tác giả Bill Peebles cho biết ông không can thiệp mà AI tự ghép thành đoạn phim hoàn chỉnh.

Điều này khiến các chuyên gia gợi nhớ về mô hình AI giải toán Olympic của ba tiến sĩ gốc Việt công bố trên tạp chí khoa học Nature tháng trước. Trong phần mô tả về kỹ thuật hoạt động của Sora, OpenAI cũng khẳng định mô hình tạo video này sẽ đóng vai trò nền tảng cho AI hiểu và mô phỏng thế giới thực.

"Chúng tôi tin đây sẽ là cột mốc quan trọng để đạt được AGI", OpenAI tuyên bố.

Điểm yếu của Sora

Theo Medium, tổng hợp văn bản thành video là nhiệm vụ thách thức vì đòi hỏi AI phải hiểu ý nghĩa và ngữ cảnh của văn bản cũng như các khía cạnh khác của hình ảnh, video và chuyển động vật lý. Một trong những lý do OpenAI giới hạn Sora cho một nhóm nhỏ dùng thử là vì nó vẫn còn một số nhược điểm.

"Sora có thể gặp khó khăn khi mô phỏng chính xác tính chất vật lý của một cảnh phức tạp. Nó có thể không hiểu đúng về các mệnh đề mang tính nguyên nhân - kết quả", OpenAI thừa nhận.

Công ty ví dụ Sora có thể sáng tạo video một người cắn bánh quy nhưng sau đó chiếc bánh còn nguyên và không có vết cắn. Nó cũng có thể nhầm lẫn các chi tiết trái phải, trước sau, ví dụ hình ảnh người đàn ông chạy ngược trên máy tập.

Sora tạo hình người đàn ông chạy ngược trên máy tập thể dục. Nguồn: OpenAI

Tuy nhiên, theo các nhà phân tích, điểm gây lo ngại lớn nhất của Sora nằm ở chính đột phá của OpenAI. Những video được tạo ra quá giống thật khiến nhiều người sợ mô hình có thể bị lạm dụng để phát tán nội dung sai lệch, vi phạm quyền riêng tư, phân biệt chủng tộc, thậm chí có thể tác động đến kết quả của các cuộc bầu cử. Dù cấm sử dụng Sora tạo nội dung xấu, công ty hiện chưa tìm được cách nhận biết đâu là hình ảnh do AI tạo ra, đâu là thật để gắn nhãn và phân loại.

Fred Havemeyer, người đứng đầu bộ phận nghiên cứu về AI của Macquarie, cho rằng khả năng đáng kinh ngạc của Sora sẽ gây ra nhiều lo lắng liên quan đến vấn đề đạo đức và ảnh hưởng tới xã hội. Theo ông, tác động tiêu cực của AI sẽ là chủ đề được tranh luận nhiều nhất trong 2024 và Sora là phát súng mở màn.

Còn theo New York Times, OpenAI vẫn giấu kỹ thông tin về những nội dung sử dụng để đào tạo Sora đến từ đâu, bao nhiêu phần trăm trong số đó có bản quyền. "Có thể họ muốn giữ bí mật để duy trì lợi thế cạnh tranh, nhưng cũng có thể họ sợ bị kiện liên quan đến bản quyền, tương tự rắc rối ChatGPT đang đối mặt", trang này viết.

Tuy nhiên, giới phân tích đều chung nhận định Sora đang mở ra một kỷ nguyên mới của AI tạo video, tương tự cách ChatGPT xuất hiện. Khi chính thức thương mại hóa, nó có thể tác động trực tiếp đến ngành điện ảnh, truyền thông và thiết kế game.

Reece Hayden, nhà phân tích cấp cao tại ABI Research, nói trên CBS News rằng trong tương lai, những AI như Sora thậm chí sẽ thay đổi mô hình hoạt động của các nền tảng như Netflix khi người dùng có thể sửa đoạn kết câu chuyện hoặc tự tạo bộ phim theo ý mình chỉ với những dòng văn bản.

Các tin khác

VN-Index vượt 1.300 điểm

3 phiên tăng liên tiếp giúp VN-Index lấy lại mốc 1.300 điểm sau khi đánh mất trong nhịp điều chỉnh mạnh vì biến động thuế quan cách đây một tháng.

Miền Bắc sắp đón mưa dông

Chiều tối và đêm nay (14/5), miền Bắc và Bắc Trung Bộ có mưa rào và dông rải rác, riêng vùng núi Bắc Bộ có mưa to đến rất to. Tây Nguyên, Nam Bộ tiếp tục mưa dông vào chiều tối nay. Các khu vực khác ngày nắng, ít mưa.

Giá vàng tiếp tục tăng

Sáng nay (11/5), giá vàng trong nước tiếp tục tăng. Theo đó, vàng miếng SJC lên mốc 122 triệu đồng/lượng, vàng nhẫn cao nhất 120 triệu đồng/lượng.

Miền Bắc, miền Trung mưa đến bao giờ?

Ngày hôm nay (11/5), khu vực miền Bắc và miền Trung tiếp tục có mưa rào và dông rải rác, nhiều nơi xảy ra mưa vừa, mưa to đến rất to, kèm theo nguy cơ lốc sét và gió giật mạnh. Từ đêm nay mưa lớn giảm dần ở khu vực này. Tây Nguyên, Nam Bộ tiếp tục có mưa dông vào chiều và tối nay.

Giá vàng SJC giảm mạnh

Sáng nay (9/5), giá vàng trong nước giảm mạnh. Theo đó, vàng miếng SJC về quanh mốc 120 triệu đồng/lượng.

Giá vàng đồng loạt tăng

Vào lúc 9h30 sáng nay (8/5), Công ty Vàng bạc đá quý Sài Gòn niêm yết giá vàng miếng SJC 120,7 - 122,7 triệu đồng/lượng, tăng nửa triệu đồng/lượng so với trước giờ mở cửa phiên giao dịch.

Cổ phiếu Novaland tăng trần

Cổ phiếu Novaland (NVL) hôm nay tăng hết biên độ lên 12.250 đồng, vùng giá cao nhất 8 tháng, khi nhà đầu tư trong và ngoài nước cùng gom hàng.

Miền Bắc nắng nóng kéo dài

Hôm nay (5/5), miền Bắc bước vào đợt nắng nóng kéo dài nhưng không gay gắt. Khu vực miền Trung đón nắng nóng diện rộng, gay gắt. Tây Nguyên, Nam Bộ ngày nắng, có nơi nắng nóng, chiều tối có mưa dông.

Giá vàng giảm mạnh

Sáng nay (2/5), giá vàng trong nước giảm mạnh. Vàng miếng SJC có nơi giảm còn 118,5 triệu đồng/lượng còn vàng nhẫn về 114,5 triệu đồng/lượng.

Giá vàng rơi thẳng đứng

Giá vàng thế giới rơi thẳng đứng trong phiên giao dịch Mỹ ngày 1.5, nâng tổng mức giảm trong ngày lên 84 USD/ounce, tương ứng mức mất giá mạnh nhất lên 2,6%.

Miền Bắc mưa đến bao giờ?

Sáng nay (1/5), mưa lớn đã bao trùm nhiều khu vực ở miền Bắc. Dự báo trong ngày hôm nay, mưa lớn tiếp tục ở khu vực miền Bắc, từ chiều tối và đêm nay mưa giảm dần. Bắc Trung Bộ hôm nay cũng có mưa rải rác. Nam Bộ và Nam Tây Nguyên mưa dông vào chiều tối. Các khu vực khác ít mưa, ngày nắng.

Giá vàng đồng loạt giảm

Lúc 9h sáng nay (28/4), các doanh nghiệp kinh doanh vàng đồng loạt điều chỉnh giảm giá vàng SJC và vàng nhẫn.

Miền Bắc, miền Trung nắng nóng đỉnh điểm

Hôm nay và ngày mai (21-22/4) là đỉnh điểm đợt nắng nóng đang diễn ra ở các tỉnh miền Bắc và miền Trung với nhiệt độ dự báo cao nhất miền Bắc từ 35-37 độ, miền Trung 36-38 độ. Nhiệt độ thực tế có thể cao hơn 2-4 độ. Chỉ số tia UV ở ngưỡng rất có hại. Các khu vực khác trên cả nước hôm nay cũng chìm trong nắng nóng.

Chứng khoán giảm sâu

FPT giảm hết biên độ và không có bên mua, trở thành tác nhân chính khiến VN-Index mất 17 điểm, nối mạch giảm 2 phiên liên tiếp.

Thời tiết miền Bắc những ngày tới

Hôm nay và ngày mai (14-15/4), miền Bắc sẽ rét về đêm và sáng, trưa chiều nắng ấm. Từ 16/4, nền nhiệt tăng mạnh. Từ 18/4, miền Bắc bước vào đợt nắng nóng diện rộng, gay gắt đầu tiên của mùa hè năm nay. Tây Nguyên và Nam Bộ trong hai ngày 14-15/4 có mưa dông rải rác vào chiều tối.

VN-Index trở lại mốc 1.200 điểm

Mở cửa với lực bán tháo mạnh, VN-Index mất mốc 1.200 điểm nhưng sau đó dần cải thiện nhờ VIC, VHM, LPB, VNM… và chốt phiên giảm hơn 19 điểm.

Miền Bắc tăng nhiệt mạnh

Hôm nay (2/4), miền Bắc chỉ còn rét về đêm và sáng, trưa chiều hửng nắng, ấm áp, nhiệt độ cao nhất khoảng 24-27 độ. Trong hai ngày 3-4/4, nền nhiệt tiếp tục tăng ở miền Bắc. Các khu vực khác hôm nay ít mưa, riêng Nam Bộ có mưa dông trái mùa.