Công nghệ

Loạt AI gây sốt trên mạng

Từ nửa sau 2022, giới công nghệ liên tục đón nhận các mô hình AI thế hệ mới với tính năng đột phá. Những hệ thống trí tuệ nhân tạo này đều có thể thực hiện các nhiệm vụ phức tạp khó thực hiện trước đó, như viết một đoạn văn dài, lập trình hoặc vẽ tranh chỉ từ một đoạn mô tả ngắn.

ChatGPT

ChatGPT được xem là AI nổi tiếng nhất hiện nay với khả năng viết luận văn, làm thơ và trả lời nhiều câu hỏi phức tạp. Siêu AI này được giới thiệu đến công chúng từ 30/11/2022 và vẫn đang tiếp tục thu hút chú ý. Giới chuyên gia nhận xét những mô hình như ChatGPT có thể thay đổi hoàn toàn cách con người giao tiếp, tìm kiếm thông tin trên Internet, mang lại cảm giác như đang trò chuyện với con người chứ không phải những dòng lập trình khô cứng.

Ảnh minh họa cho AI ChatGPT. Ảnh: Erick Butler/Unsplash

Ảnh minh họa cho AI ChatGPT. Ảnh: Erick Butler/Unsplash

ChatGPT được phát triển từ nguyên mẫu GPT-3.5 nhưng được đào tạo để đưa ra câu trả lời giống một cuộc trò chuyện. Mô hình GPT-3 ra mắt năm 2020 chỉ dự đoán đoạn văn sẽ xuất hiện sau một chuỗi từ nhất định, còn ChatGPT tương tác với câu hỏi của người dùng theo phong cách giữa người với người. Kết quả là những câu trả lời có độ trôi chảy không kém người thật, cùng khả năng đối thoại về hàng loạt chủ đề, thể hiện tiến bộ lớn so với các chatbot xuất hiện cách đây chỉ vài năm.

Tuy nhiên, ChatGPT cũng gây lo ngại, ẩn chứa rủi ro khi được phổ cập cho mọi nhà. Guardian cho rằng siêu AI được đào tạo dựa trên một lượng lớn văn bản từ Internet. Nhiều nội dung không được sự cho phép của tác giả, dẫn đến tranh cãi về việc công nghệ có thể bị lạm dụng để "rửa bản quyền", tiếp tay cho tình trạng đạo văn. Số khác lo ChatGPT sẽ mở đầu cho sự sụp đổ của giới trí thức văn phòng hay lập trình viên. Các sinh viên cũng có thể dùng nó để làm các bài tập, tiểu luận một cách tinh vi. Một số đơn kiện đã được gửi lên các tòa án tại Mỹ để ngăn chặn AI này.

Lensa AI

Lensa là phần mềm AI ra mắt từ năm 2018, nhưng bất ngờ nổi lên từ cuối tháng 11/2022, khi người dùng trên thế giới chia sẻ ảnh kỹ thuật số nghệ thuật tạo từ ứng dụng. Công cụ thu hút chú ý khi bổ sung tính năng "ảnh đại diện ma thuật", cho phép tạo những bức ảnh đẹp mắt và mới lạ chỉ sau một vài thao tác.

MC Phương Mai tạo ảnh nghệ thuật bằng Lensa: Ảnh: Khương Nha

MC Phương Mai tạo ảnh nghệ thuật bằng Lensa: Ảnh: Khương Nha

Lensa AI được xây dựng trên công cụ nguồn mở miễn phí của Stable Diffusion. Ứng dụng yêu cầu người dùng tải lên 10-20 ảnh của chính họ. Các thuật toán sẽ xử lý để cho ra một bộ ảnh chân dung theo nhiều phong cách như khoa học viễn tưởng, giả tưởng và phim hoạt hình.

Tuy nhiên, theo Wired, AI với khả năng chỉnh sửa ảnh đẹp như mơ của Lensa lại có thể khởi đầu cho một cơn ác mộng tồi tệ với cộng đồng. Nhiều người bắt đầu lạm dụng Lensa để tạo ra ảnh khiêu dâm, phân biệt chủng tộc, quấy rối... Ứng dụng cũng làm dấy lên những cuộc thảo luận về đạo đức nghệ thuật khi các họa sĩ cáo buộc nhà phát triển ứng dụng đã đánh cắp tác phẩm của họ để huấn luyện AI. Một số nghệ sĩ đang kêu gọi một vụ kiện tập thể chống lại Lensa và những phần mềm tương tự.

Vall-E

Vall-E là AI mới nhất tạo ấn tượng nhờ khả năng bắt chước giọng nói của bất kỳ ai chỉ trong ba giây. Nền tảng do Microsoft phát triển có thể bắt chước âm sắc và cách nói của con người bằng cách nghe giọng của họ. Dù âm thanh vẫn hơi giống giọng robot, kết quả được đánh giá là rất triển vọng.

Minh họa AI Vall-E của Microsoft. Ảnh: VallE-Demo

Minh họa AI Vall-E của Microsoft. Ảnh: VallE-Demo

Theo Microsoft, Vall-E được xây dựng trên nền tảng EnCodec, một codec âm thanh sử dụng kỹ thuật máy học do Meta phát triển năm 2022. Nếu trước đây, các phương pháp chuyển văn bản thành giọng nói thường ở dạng sóng, Vall-E tạo codec âm thanh riêng biệt bằng cách thu nhận và phân tích âm thanh mỗi người, sau đó chia nhỏ thông tin thành các phần gọi là "token" qua EnCodec. Cuối cùng, AI này sử dụng dữ liệu huấn luyện để khớp với những gì nó "biết" về ngữ điệu giọng nói, sau đó có thể nói các cụm từ khác theo đúng những gì "học" được. Toàn bộ quá trình được thực hiện trong ba giây - mức nhanh nhất so với bất kỳ hệ thống AI bắt chước ngôn ngữ nào hiện nay.

Dù vậy, giới chuyên gia lo ngại Vall-E có thể bị dùng cho mục đích xấu. AI này có thể giả giọng để lừa đảo, thực hiện hành vi tống tiền. Nếu kết hợp với video deepfake, mức độ nguy hiểm có thể nhân lên nhiều lần.

Midjourney

Midjourney ra mắt năm 2021, nhưng rộ lên từ tháng 8/2022 khi cho phép tạo tranh miễn phí. Để sử dụng, người dùng cần có tài khoản và tham gia cộng đồng trên Discord của Midjourney. Mỗi tài khoản được dùng miễn phí 25 lần, sau đó trả phí 10-30 USD mỗi tháng tùy tần suất, tốc độ.

Bức tranh AI vẽ cho mô tả đêm đầy sao, trăng tròn ở góc phải, cánh đồng hoa hướng dương, một phụ nữ tóc đen nhìn lên mặt trăng, phong cách Van Gogh. Ảnh: Discord Midjourney

Bức tranh được AI vẽ cho mô tả "Đêm đầy sao, trăng tròn ở góc phải, cánh đồng hoa hướng dương, một phụ nữ tóc đen nhìn lên mặt trăng, phong cách Van Gogh". Ảnh: Discord Midjourney

Chỉ sau vài tháng, hàng triệu người đã dùng Midjourney để tạo ảnh, dựng phim, làm bìa tạp chí, tranh minh họa... Hồi tháng 8/2022, tạp chí The Atlantic từng hứng chỉ trích vì một biên tập viên đã sử dụng Midjourney để vẽ minh họa nhân vật cho bài viết, thay vì mua ảnh hay thuê người vẽ. Giới họa sĩ cho rằng quyết định đó có thể dẫn đến một tương lai là các nhà xuất bản không cần người vẽ tranh minh họa, hoặc có thể cắt giảm ngân sách cho vấn đề nghệ thuật. AI này thậm chí còn giành giải trong cuộc triển lãm hội họa tại Hội chợ bang Colorado thời gian sau đó, khiến nhiều nghệ sĩ phản ứng.

Giới nghệ sĩ lo ngại, bên cạnh việc bị đánh cắp bản quyền, các tác phẩm của họ đang được dùng để huấn luyện phần mềm và có thể giành giật chính công việc của họ trong tương lai.

Dall-E 2

Một AI nổi tiếng khác của OpenAI là Dall-E. Thu hút chú ý từ năm ngoái, Dall-E và sau đó là thế hệ Dall-E 2 gây sốt nhờ khả năng tạo bất kỳ bức ảnh siêu thực nào chỉ với một đoạn mô tả.

Dall-E cho ra hình ảnh với các từ khóa ấm trà quả bơ, chó Shiba đội mũ beret và áo cổ lọ, bát súp trông như quái vật bằng len, mèo chơi cờ và căn phòng đầy cát có piano. Ảnh: Dall-E

Dall-E cho ra hình ảnh với các từ khóa "ấm trà quả bơ", "chó Shiba đội mũ beret và áo cổ lọ", "bát súp trông như quái vật bằng len", "mèo chơi cờ" và "căn phòng đầy cát có piano". Ảnh: Dall-E

Không chỉ tạo ảnh, Dall-E còn có thể chỉnh sửa ảnh nhanh chóng theo yêu cầu. Chỉ cần đổi câu lệnh, hình ảnh trên màn hình lập tức chuyển đổi với độ chính xác gần như đúng với ý của người đã ra lệnh cho AI.

Tuy vậy, tính năng này cũng khiến một số chuyên gia lo lắng. Khi được hoàn thiện hơn, nó có thể chỉnh ảnh và lan truyền thông tin sai lệch trên Internet, tiếp tay cho những chiến dịch có chủ đích trên nền tảng trực tuyến.

tổng hợp

Cùng chuyên mục

Đọc thêm