Công nghệ

TikTok Trung Quốc lần đầu công bố thuật toán gây nghiện

Tóm tắt:
  • ByteDance công bố chi tiết về thuật toán đề xuất nội dung của TikTok tại Diễn đàn truyền thông internet Trung Quốc 2025.
  • Douyin dự đoán hành vi người dùng thay vì chỉ gán nhãn, qua mạng nơ-ron phức tạp để gợi ý nội dung.
  • Thuật toán sử dụng nhiều mô hình như lọc cộng tác và học sâu để xác định sở thích người dùng và đề xuất video tương tự.
  • TikTok gặp khó khăn khi đề xuất nội dung không phù hợp, cần sự can thiệp của quản trị viên để điều chỉnh.
  • Việc công khai thuật toán là bước đi tích cực nhằm tăng cường tính minh bạch và giảm thiểu vấn đề liên quan đến nội dung độc hại.

Tại Diễn đàn truyền thông internet Trung Quốc 2025 diễn ra hồi cuối tháng 3, Chủ tịch Han Shangyou của Douyin (phiên bản TikTok tại Trung Quốc) tuyên bố nhiều người vẫn đang hiểu nhầm về thuật toán của nền tảng. Douyin không đề xuất nội dung bằng cách gán nhãn mà trực tiếp dự đoán hành vi, nhu cầu mục tiêu của từng người với từng nội dung thông qua loạt phép tính toán mạng nơ-ron phức tạp, từ đó chọn ra nội dung có xác suất cao nhất để gợi ý cho hàng triệu người dùng khác nhau cùng lúc.

Để giải thích rõ hơn về nguyên tắc đề xuất nội dung, logic đằng sau các thuật toán đặc biệt, Douyin lần đầu giới thiệu trang web Trung tâm bảo mật và tin cậy để vén màn một trong những bí mật lớn nhất của ngành công nghệ.

TikTok vén màn bí thuật

Khác hình dung của phần lớn người dùng cho rằng chỉ khi có lượng thời gian xem hoặc tương tác với video nhất định, hệ thống mới dựa vào đó để đưa ra các dự đoán tiếp theo, công ty mẹ TikTok cho biết ngay khi người dùng vừa mở ứng dụng, thuật toán đã bắt đầu chấm điểm các video và gợi ý nội dung phù hợp nhất.

Vén màn bí mật: TikTok Trung Quốc lần đầu  - Ảnh 1.

Logo TikTok - phiên bản quốc tế của ứng dụng Douyin ở Trung Quốc

ẢNH: KHƯƠNG NHA

Trong quá trình xem video người dùng sẽ thực hiện nhiều tương tác khác như đọc mô tả, nhấn vào xem thêm, đọc bình luận, ấn thích, chia sẻ... Mọi phản hồi đó đều trở thành dữ liệu quyết định nội dung tiếp theo nào sẽ được đề xuất.

Logic cốt lõi trong thuật toán TikTok là xác định mức độ ưu tiên của các video đề xuất bằng cách dự đoán xác suất hành vi của người dùng và trọng số (mức độ quan trọng khác nhau của các số trong một tập dữ liệu) giá trị của các hành vi.

Phương pháp đề xuất dựa trên hành vi của người dùng này dựa vào nhiều mô hình kỹ thuật khác nhau, từ lọc cộng tác đến học sâu... Thuật toán có thể tìm thấy những người cùng sở thích mà không cần hiểu đầy đủ nội dung, đề xuất mà người kia quan tâm.

Thuật toán kinh điển nhất

Một trong những thuật toán đặc biệt nhất của TikTok là lọc cộng tác. Nói một cách dễ hiểu, đây là quá trình phối hợp hành vi của người dùng để bóc tách lượng lớn thông tin lại với nhau và lọc nhanh hơn những nội dung người có khả năng thực hiện hành động (xem đến cuối video hoặc ấn thích).

Ví dụ khi một người dùng A, xem các nội dung x, y và z; người dùng B xem các nội dung x, z và w. Như vậy A và B có sự tương đồng cao trong hai nội dung x và z. Từ đây, hệ thống sẽ đề xuất các nội dung khác tương tự để tiếp tục gợi ý video tiếp theo. Mặc dù về phương pháp, việc xác định các tương đồng và lựa chọn đề xuất rất phức tạp nhưng chúng đều dựa trên một nguyên tắc cốt lõi là tìm những người dùng có sở thích tương tự và giới thiệu nội dung người kia quan tâm để đề xuất cho người này.

Ngoài ra TikTok còn dùng mô hình học sâu để nâng cao "khả năng ghi nhớ", giúp thuật toán học trực tiếp và dùng "tần suất đồng xuất hiện" của các mục hoặc tính năng trong dữ liệu lịch sử. Mô hình này cũng cung cấp cho nền tảng khả năng "khái quát hóa" để tìm kiếm mối tương quan giữa các đặc điểm nhận dạng rời rạc, thậm chí hiếm khi xuất hiện, từ đó giải quyết các vấn đề liên quan đến khả năng gợi ý chính xác dù có rất ít dữ liệu về người dùng. Đây là bước đà quan trọng cho thuật toán lọc cộng tác ban đầu.

Việt Nam sẽ kiểm tra những gì tại TikTok?

Dù thuật toán của TikTok còn có thể tự học và dự đoán hành vi của người dùng nhưng vẫn không thể hiểu chính xác ngữ cảnh nội dung nên có khả năng đề xuất không phù hợp, thậm chí có hại. Đó là lý do vì sao một mặt TikTok vô cùng thành công với thuật toán của mình, mặt khác nền tảng cũng gặp nhiều rắc rối khi đề xuất nội dung xấu đến nhóm khách dễ tổn thương.

Trong trường hợp này, các quản trị viên nền tảng sẽ có trách nhiệm điều chỉnh và hạn chế nội dung. Hệ thống quản trị của TikTok cho phép những người này phát hiện nội dung bất thường dựa trên các bộ tiêu chuẩn. Trong đó máy móc đóng vai trò nhận dạng, phân tích, con người đảm bảo các vấn đề về "chuyên môn", gắn nhãn nhạy cảm hoặc phân tích những trường hợp phức tạp.

Hiểu hành vi con người bằng thuật toán

Tóm lại, để phá vỡ 'kén' thông tin, thuật toán Douyin đã thiết lập một chiều khám phá đặc biệt theo hệ thống mô hình đa mục tiêu. Đầu tiên, dựa trên sở thích mà người dùng đã thể hiện trên nền tảng, để đề xuất càng nhiều nội dung đa dạng càng tốt. Song song đó nền tảng tiếp tục kiểm soát tần suất của các nội dung tương tự thông qua các phương pháp như phân mảnh đa dạng, tập hợp nhiều sở thích và hỗ trợ cho các sở thích ngách.

Tiếp đến, họ giúp người dùng khám phá thêm nhiều sở thích mới bằng cách áp dụng các phương pháp khác nhau như khám phá ngẫu nhiên, mở rộng sở thích dựa trên mối quan hệ xã hội, liên kết đề xuất tìm kiếm và bỏ hiển thị "không quan tâm". Điều này cho phép hành vi chủ động của người dùng trực tiếp tác động đến thuật toán, giúp cá nhân hóa tốt hơn nhưng vẫn đảm bảo tính đa dạng.

TikTok Trung Quốc nhấn mạnh giá trị cốt lõi họ theo đuổi là dùng thuật toán để tìm hiểu hành vi con người, thông qua các phép tính. Tuy nhiên TikTok phiên bản Trung Quốc lẫn quốc tế vẫn đang đối mặt nhiều tranh cãi liên quan đến việc đề xuất nội dung giật gân, độc hại hay sai lệch thông tin. Do đó việc Douyin hay TikTok quyết định công khai "công thức bí mật" với thế giới được xem là bước đi tích cực trong nỗ lực minh bạch hóa của nền tảng.

Các tin khác

Giá vàng đồng loạt giảm mạnh

Sáng nay (20/4), cả vàng SJC và vàng nhẫn đều giảm mạnh, bằng giá nhau ở mốc 114 triệu đồng/lượng. Hiện, giá vàng, trong nước vẫn cao hơn thế giới hơn 9 triệu đồng/lượng.

Đằng sau ‘vỏ bọc’ thành đạt của tên tội phạm ma tuý đặc biệt nguy hiểm Bùi Đình Khánh

Bùi Đình Khánh được hàng xóm nhận xét là ngoan hiền, lễ phép và không có bất cứ điều tiếng gì. Trang cá nhân cũng ngập tràn những hình ảnh sang chảnh của một doanh nhân thành đạt. Nhưng đằng sau Khánh là cả một băng nhóm tội phạm buôn bán ma túy liên tỉnh cực kỳ nguy hiểm và manh động.

"Tối hậu thư" về thực hiện xuất hóa đơn điện tử kinh doanh xăng dầu

Bộ Công Thương yêu cầu các thương nhân đầu mối, phân phối, tổng đại lý xăng dầu hoàn thành việc số hoá trong lĩnh vực kinh doanh xăng dầu trước ngày 30/4. Thương nhân nào không thực hiện quy định về hoá đơn điện tử và kết nối dữ liệu với cơ quan thuế sẽ coi như không đủ điều kiện kinh doanh xăng dầu và bị thu hồi giấy phép.

‘Bộ tứ’ thương hiệu bảo chứng chất lượng thành phố dưỡng lành La Pura

Nhà phát triển Realty Holdings – Đơn vị tư vấn chiến lược và triển khai Big Four - Tổng thầu xây dựng CENTRAL – Ngân hàng VPBank vừa ký kết hợp tác chiến lược, đồng hành phát triển thành phố dưỡng lành La Pura tại 'Sự kiện ký kết hợp tác chiến lược dự án' diễn ra ngày 18.4 tại GEM Center (Quận 1, TP.HCM).