Công nghệ

Chuyện gì đang xảy ra: Gõ một chữ trên Facebook lại ra video nội dung bẩn, thuật toán triệu USD của Meta đang bị qua mặt?

 - Ảnh 1.

Những ngày qua, cộng đồng người dùng Facebook tại Việt Nam và nhiều nơi trên thế giới đã phải trải qua một phen ngỡ ngàng xen lẫn bức xúc khi sử dụng công cụ tìm kiếm của nền tảng Meta (Facebook).

Thay vì hiển thị các xu hướng, bài đăng hay thước phim đang thịnh hành khi gõ từ khóa vô cùng thông dụng là "vi***", hệ thống lại trả về một danh sách dài dằng dặc các video có nội dung người lớn.

Đáng lo ngại hơn, trên các phiên bản ứng dụng di động, những video này còn tự động phát kèm âm thanh ngay khi xuất hiện trên màn hình, gây ra không ít tình huống dở khóc dở cười cho người dùng nơi công sở hoặc trước mặt trẻ nhỏ.

Đây không phải lần đầu tiên công cụ tìm kiếm của Meta để lộ khoảng trống chết người này. Cuối năm ngoái, một sự cố tương tự cũng từng xảy ra khi người dùng chỉ cần gõ các ký tự đơn lẻ như "b", "c" hay "x" là thế giới ngầm của những nội dung người lớn lập tức hiển thị công khai.

Việc một hệ thống tìm kiếm được nuôi dưỡng bằng hàng tỷ USD mỗi năm của Meta liên tục "thất thủ" trước các từ khóa cơ bản đang dấy lên những hoài nghi lớn về năng lực kiểm soát nội dung của mạng xã hội lớn nhất hành tinh.

 - Ảnh 2.

Để hiểu được tại sao lỗi này lại dễ dàng lặp lại như vậy, chúng ta cần bóc tách các mánh khóe công nghệ mà giới spammer đang sử dụng để qua mặt bộ lọc kiểm duyệt.

Trò “Treo đầu dê, bán thịt chó” của giới spammer

Thoạt nhìn, nhiều người cho rằng đây là lỗi của Facebook. Tuy nhiên, dưới góc độ công nghệ nền tảng, câu chuyện thực tế phức tạp hơn nhiều.

Trái với suy nghĩ của nhiều người rằng các video nhạy cảm này lọt qua bộ lọc của Facebook nhờ những thuật toán mã hóa siêu việt, thực tế giới spammer lại sử dụng những thủ thuật tương đối thủ công nhưng cực kỳ hiệu quả đối với hệ thống trí tuệ nhân tạo (AI) kiểm duyệt. Phương thức phổ biến nhất hiện nay là kỹ thuật "cloaking" (che mắt thuật toán) kết hợp với việc tạo các đoạn giới thiệu giả.

Hệ thống kiểm duyệt tự động của Facebook quét các video dựa trên các khung hình (frames) đầu tiên và các mốc thời gian ngẫu nhiên để xác định xem video đó có vi phạm tiêu chuẩn cộng đồng hay không.

Nắm được điểm yếu này, các đối tượng phát tán nội dung bẩn đã tinh vi lồng ghép một đoạn intro dài từ 5 đến 10 giây ở đầu video với nội dung hoàn toàn lành mạnh, ví dụ như một clip hướng dẫn nấu ăn, một meme hài hước hoặc một đoạn phim hoạt hình vui nhộn.

Khi AI quét qua phần đầu của tệp tin, nó nhanh chóng gắn nhãn "an toàn" cho video và cho phép xuất bản. Tuy nhiên, ngay sau phần giới thiệu vô hại đó lại là toàn bộ nội dung người lớn được cắt ghép từ các nguồn không chính thống.

Bên cạnh đó, các spammer còn sử dụng kỹ thuật can thiệp kỹ thuật số nhẹ lên video như thay đổi tần số âm thanh, lật ngược khung hình, chèn các lớp mờ (overlay) siêu mỏng hoặc thay đổi dải màu để làm lệch hướng nhận diện của thuật toán so khớp vân tay video (Video Fingerprinting). Bằng cách này, video dù có nội dung người lớn cũ đã bị cấm trước đó vẫn được hệ thống nhận diện như một tệp đa phương tiện hoàn toàn mới và chưa từng vi phạm.

Ngoài ra, việc phụ thuộc vào thuật toán của Meta cũng là điểm yếu chí mạng. Trong kỷ nguyên thuật toán, từ khóa không còn là yếu tố duy nhất quyết định kết quả tìm kiếm. Các nền tảng mạng xã hội hiện đại ngày càng chuyển sang mô hình "tìm kiếm theo mức độ liên quan" thay vì "tìm kiếm theo từ khóa thuần túy".

 - Ảnh 3.

Điều đó đồng nghĩa hệ thống sẽ đánh giá đồng thời hàng loạt tín hiệu như mức độ tương tác, tỷ lệ xem hết video, số lượt chia sẻ, lịch sử hành vi của người dùng và xu hướng đang được lan truyền trên toàn nền tảng.

Chính cơ chế này đã tạo ra một nghịch lý. Nhiều nội dung người lớn thường có tỷ lệ giữ chân người xem rất cao. Người dùng có xu hướng dừng lại lâu hơn, xem kỹ hơn hoặc tương tác nhiều hơn so với các nội dung thông thường. Đối với thuật toán, đây là tín hiệu cho thấy nội dung "hấp dẫn", từ đó được ưu tiên phân phối rộng hơn.

Không ít nhà sáng tạo nội dung spam đã nhanh chóng nhận ra điểm yếu này. Họ cố tình gắn các hashtag phổ biến như #vi***, #trending, #hotvideo hay #fyp vào những video nhạy cảm nhằm tận dụng hệ thống đề xuất và tìm kiếm. Kết quả là khi người dùng tra cứu những từ khóa mang tính đại chúng như "vi***", hệ thống có thể trả về các video hoàn toàn không liên quan đến ý nghĩa thực sự của từ khóa đó.

Một yếu tố khác nằm ở sự thay đổi trong triết lý vận hành của các mạng xã hội.

Trước đây, công cụ tìm kiếm chủ yếu hoạt động giống Google, tập trung vào việc khớp từ khóa. Hiện nay, Facebook, TikTok hay Instagram ngày càng vận hành theo mô hình "discovery engine" hay cỗ máy khám phá nội dung. Mục tiêu không phải là tìm chính xác thứ người dùng gõ vào, mà là hiển thị thứ thuật toán cho rằng người dùng có khả năng dành nhiều thời gian nhất để xem.

Điều này lý giải vì sao hai người cùng gõ một từ khóa nhưng lại nhận được kết quả hoàn toàn khác nhau. Thuật toán đã được cá nhân hóa dựa trên lịch sử xem video, các trang đã theo dõi, nhóm đã tham gia và hàng trăm tín hiệu hành vi khác.

Các chuyên gia về nền tảng số cho rằng hiện tượng này phản ánh thách thức ngày càng lớn của các mạng xã hội trong việc cân bằng giữa tăng trưởng tương tác và kiểm soát nội dung. Những thuật toán được tối ưu để giữ chân người dùng thường vô tình tạo lợi thế cho các nội dung gây sốc, kích thích tò mò hoặc đánh vào bản năng của con người.

Đó cũng là lý do nhiều nền tảng liên tục phải điều chỉnh hệ thống xếp hạng, tăng cường lọc nội dung nhạy cảm và xử lý các tài khoản spam. Tuy nhiên, cuộc đua giữa thuật toán kiểm duyệt và những người tìm cách lách thuật toán dường như vẫn chưa có hồi kết.

Với người dùng thông thường, việc xuất hiện các video người lớn khi tìm kiếm từ khóa "vi***" không hẳn là dấu hiệu tài khoản bị xâm nhập hay Facebook gặp lỗi nghiêm trọng. Trong nhiều trường hợp, đây đơn giản là hệ quả của một hệ sinh thái nội dung nơi mọi nhà sáng tạo đều đang cạnh tranh để giành lấy thứ tài nguyên quý giá nhất trên Internet hiện nay là sự chú ý.

if (pageSettings.allow3rd) admicroAD.unit.push(function () { admicroAD.show('admzonek1fs4xky') });

Các tin khác

Công nghệ radar ngoài tầm nhìn JORN có gì đặc biệt?

Công nghệ radar ngoài tầm nhìn JORN có gì đặc biệt?

Úc ký hợp đồng xuất khẩu quốc phòng lớn nhất lịch sử trị giá 2,5 tỷ đô la Úc với Canada, chuyển giao công nghệ radar ngoài tầm nhìn Jindalee (JORN), giúp Canada tăng cường giám sát khu vực Bắc Cực trước các thách thức an ninh ngày càng tăng.
Search "Messi" trên Google sẽ thấy điều đặc biệt

Search "Messi" trên Google sẽ thấy điều đặc biệt

Vượt qua cả Miroslav Klose để trở thành tay săn bàn vĩ đại nhất mọi thời đại tại các kỳ World Cup, Lionel Messi đã khiến Google phải thiết kế riêng một màn ăn mừng hoành tráng ngay trên trang chủ tìm kiếm.
Meta dừng theo dõi máy tính nhân viên

Meta dừng theo dõi máy tính nhân viên

Meta thông báo dừng chương trình theo dõi máy tính nhân viên, trong đó thu thập thao tác chuột và bàn phím, để điều tra vấn đề bảo mật thông tin.
Cận cảnh hệ thống 121 camera AI trên tuyến cao tốc hơn 17.000 tỷ đồng: "Mắt thần" giám sát liên tục 24/7, thông tin trực tiếp gửi về trung tâm điều hành

Cận cảnh hệ thống 121 camera AI trên tuyến cao tốc hơn 17.000 tỷ đồng: "Mắt thần" giám sát liên tục 24/7, thông tin trực tiếp gửi về trung tâm điều hành

Tuyến cao tốc Bắc - Nam có tổng vốn đầu tư gần 17.400 tỷ đồng đi qua địa bàn Hà Tĩnh đang hoàn thiện hệ thống giao thông thông minh với 121 camera AI và trung tâm điều hành hiện đại, chuẩn bị đưa vào vận hành trước thời điểm thu phí.
7 trường hợp Vietcombank, BIDV, Agribank, VietinBank tạm ngừng giao dịch rút và chuyển tiền theo quy định mới

7 trường hợp Vietcombank, BIDV, Agribank, VietinBank tạm ngừng giao dịch rút và chuyển tiền theo quy định mới

Ngân hàng Nhà nước và các cơ quan quản lý vừa siết chặt quy định về định danh tài khoản, khiến hàng loạt ngân hàng lớn đồng loạt áp dụng lệnh tạm ngừng giao dịch nếu khách hàng vi phạm. Dưới đây là 7 trường hợp người dùng cần đặc biệt lưu ý để tránh tình trạng tài khoản bị "đóng băng", không thể rút hay chuyển tiền.
Tuần tồi tệ của Google

Tuần tồi tệ của Google

Hai nhà nghiên cứu nổi tiếng tại Google là Noam Shazeer và John Jumper cùng nghỉ việc trong một tuần, trong khi giá cổ phiếu của công ty giảm mạnh.