Google sắp tung Veo 3.1 tuyên chiến với Sora 2

Google Veo 3.1 sắp ra mắt để giải quyết bài toán khó nhất của việc tạo video bằng AI (trí tuệ nhân tạo).

Theo TechRadar, cuộc chạy đua trong lĩnh vực video AI đang nóng lên từng ngày. Veo 3.1, phiên bản mới nhất của công cụ tạo video AI nổi tiếng từ Google, đã bắt đầu có mặt thông qua các dịch vụ của bên thứ ba. Theo những thông tin đầu tiên, bản cập nhật này sẽ hỗ trợ nhiều câu lệnh để tạo hiệu ứng đa cảnh quay, đồng thời có thể tạo ra các video ở độ phân giải 1.080p với thời lượng lên đến 1 phút.

Trước đó, Google Veo 3 gây ấn tượng mạnh với khả năng đồng bộ khẩu hình miệng của nhân vật với âm thanh một cách hoàn hảo. Giờ đây, Veo 3.1 hứa hẹn sẽ đưa mọi thứ lên một tầm cao mới. Mặc dù phiên bản này chưa được tích hợp vào chatbot Gemini, người dùng đã có thể trải nghiệm nó thông qua các nền tảng tạo video AI của bên thứ ba như Higgsfield, Imagine Art và Envato.

Google sắp tung Veo 3.1 đầy mạnh mẽ tuyên chiến với Sora 2 - Ảnh 1. — Veo 3.1 hứa hẹn sẽ là đối thủ sừng sỏ của Sora 2

Video dài hơn và nhân vật nhất quán

Trang web của Higgsfield mô tả: "Dù bắt đầu từ văn bản hay hình ảnh, Veo 3.1 đảm bảo các nhân vật luôn nhất quán trong mọi khung hình, môi trường chuyển cảnh một cách tự nhiên và các góc quay thay đổi với độ chính xác như một studio sản xuất thực thụ".

Mô tả này cho thấy một bước tiến vượt bậc so với các clip 8 giây đơn giản của Veo 3. Higgsfield cũng liệt kê khả năng tạo video dài hơn 30 giây là một lợi ích của Veo 3.1. Trong khi đó, Imagine Art nhấn mạnh: "Với Google Veo 3.1, bạn không cần phải nhìn lại lần thứ hai để đảm bảo tính nhất quán của nhân vật và bối cảnh. Nó nắm bắt sự tương tác giữa nhân vật và cảnh vật một cách hoàn hảo".

Veo 3.1 còn đi kèm với các Cinematic Presets. Tính năng này cho phép người dùng kiểm soát hoàn toàn câu chuyện hình ảnh của mình, dễ dàng kết hợp các hiệu ứng phức tạp như cảnh quay flycam, lia máy chậm/nhanh, zoom, cảnh quay theo dõi... mà không cần phải viết những câu lệnh phức tạp.

Google sắp tung Veo 3.1 đầy mạnh mẽ tuyên chiến với Sora 2 - Ảnh 2. — Thông tin về Veo 3.1 trên Imagine Art

Tính năng đa câu lệnh đột phá của Veo 3.1

Một bài đăng trên mạng xã hội của nhà làm phim AI Volodymyr Cherner tiết lộ rằng Veo 3.1 có thể tạo ra các video clip dài tới một phút. Cherner viết: "Một trong những tính năng chính để biện minh cho con số '.1' trong tên gọi là tính nhất quán của nhân vật. Giờ đây, nhân vật do AI tạo ra sẽ không còn bị đổi màu mắt hay số ngón tay giữa các cảnh quay. Ít nhất, đó là lời hứa".

Ông cũng tuyên bố mô hình này sẽ hỗ trợ nhiều loại hình ảnh hơn và đặc biệt là "tính năng đa câu lệnh cho đa cảnh quay (bạn có thể viết nhiều câu lệnh để tạo ra nhiều cảnh dựa trên bức ảnh duy nhất)."

Từ những chi tiết bị rò rỉ, Veo 3.1 đã cho thấy mình là một đối thủ đáng gờm của Sora 2 mới ra mắt của OpenAI. Khả năng sử dụng nhiều câu lệnh và tạo video đa cảnh quay mở ra tiềm năng đạo diễn những phân cảnh phức tạp hơn nhiều và thời lượng video dài hơn cũng sẽ hỗ trợ lớn cho quá trình này.

Trong khi giới công nghệ vẫn đang chờ Veo 3.1 được bổ sung vào Google Gemini, người dùng quan tâm có thể tham gia danh sách chờ để sử dụng mô hình mới này tại Higgsfield hoặc truy cập qua các trang web Envato và Imagine Art.

//Chèn ads giữa bài (runinit = window.runinit || []).push(function () { //Nếu k chạy ads thì return if (typeof _chkPrLink != 'undefined' && _chkPrLink) return; var mutexAds = '<zone id="l2srqb41"></zone>'; var content = $('[data-role="content"]'); if (content.length > 0) { var childNodes = content[0].childNodes; for (i = 0; i < childNodes.length; i++) { var childNode = childNodes[i]; var isPhotoOrVideo = false; if (childNode.nodeName.toLowerCase() == 'div') { // kiem tra xem co la anh khong? var type = $(childNode).attr('class') + ''; if (type.indexOf('VCSortableInPreviewMode') >= 0) { isPhotoOrVideo = true; } } try { if ((i >= childNodes.length / 2 - 1) && (i < childNodes.length / 2) && !isPhotoOrVideo) { if (i <= childNodes.length - 3) { childNode.after(htmlToElement(mutexAds)); arfAsync.push("l2srqb41"); } break; } } catch (e) { } } } }); function htmlToElement(html) { var template = document.createElement('template'); template.innerHTML = html; return template.content.firstChild; }

if (window.pageSettings && pageSettings.allow3rd && (typeof window._isAdsHidden === 'undefined' || !window._isAdsHidden)) { if (!laNuocNgoai) { (function (w, q) { w[q] = w[q] || []; w[q].push(["_mgc.load"]); })(window, "_mgq"); } } (function() { if (!(window.pageSettings && pageSettings.allow3rd && (typeof window._isAdsHidden === 'undefined' || !window._isAdsHidden))) return; if (typeof window.laNuocNgoai === 'undefined' || !window.laNuocNgoai) return; // chỉ chạy khi laNuocNgoai true var containerSelector = 'div.detail-cmain'; var root = document.querySelector(containerSelector); if (!root) return; // Thu thập figure + p (p không nằm trong figure) var figures = Array.from(root.querySelectorAll('figure')); var paragraphs = Array.from(root.querySelectorAll('p')).filter(function(p){ return !p.closest('figure'); }); var elements = figures.concat(paragraphs); // NodeList vốn đã theo DOM order => không cần sort if (!elements.length) return; var target = elements[Math.floor(elements.length / 2)]; // giữa bài if (!target || !target.parentNode) return; var newDiv = document.createElement('div'); newDiv.id = 'taboola-mid-article-widget'; target.parentNode.insertBefore(newDiv, target.nextSibling); window._taboola = window._taboola || []; window._taboola.push({ mode: 'thumbnails-4x1', container: 'taboola-mid-article-widget', placement: 'Mid Article Widget', target_type: 'mix' }); })();