Công nghệ

Mô hình AI có thể tìm ra thông tin người dùng ẩn danh trên mạng

Theo Arstechnica, các tài khoản ẩn danh từ lâu được xem là lớp bảo vệ tối thiểu cho quyền riêng tư khi thảo luận trực tuyến. Tuy nhiên, một nghiên cứu mới cho thấy các mô hình ngôn ngữ lớn (LLM) có thể liên kết những tài khoản tưởng như ẩn danh với danh tính ngoài đời thực bằng cách phân tích nội dung bài viết trên nhiều nền tảng. Kết quả thử nghiệm cho thấy tỷ lệ truy vết thành công bằng mô hình AI cao hơn đáng kể so với các phương pháp giải ẩn danh truyền thống vốn dựa vào dữ liệu cấu trúc hoặc điều tra thủ công.

Trong nghiên cứu nhóm tác giả xây dựng nhiều bộ dữ liệu từ các nền tảng công khai nhằm kiểm tra khả năng suy luận của LLM. Một tập dữ liệu kết hợp bài viết trên trang web Hacker News với hồ sơ LinkedIn được liên kết bằng các tham chiếu chéo xuất hiện trong hồ sơ người dùng. Sau khi loại bỏ mọi chi tiết nhận dạng trực tiếp, các nhà nghiên cứu yêu cầu mô hình phân tích văn bản còn lại để tìm dấu hiệu trùng khớp. Trong thử nghiệm này, chỉ số nhận diện đạt tới 68%.

Mô hình AI có thể tìm ra thông tin người dùng ẩn danh trên mạng - Ảnh 1.

Ẩn danh trực tuyến cho phép người dùng chia sẻ nội dung mà không tiết lộ danh tính, nhưng dấu vết dữ liệu và thói quen hoạt động vẫn có thể bị phân tích

ẢNH: TẠO BỞI AI

Nhóm nghiên cứu cũng thử nghiệm các kịch bản khác nhằm đánh giá mức độ suy luận từ thông tin rất hạn chế. Trong một trường hợp, mô hình LLM phân tích bản ghi phỏng vấn đã được ẩn danh và trích xuất các tín hiệu như lĩnh vực nghiên cứu, công cụ lập trình, phong cách tiếng Anh và bối cảnh học thuật. Từ những chi tiết này, hệ thống tự động tìm kiếm trên web để xác định một cá nhân phù hợp với toàn bộ đặc điểm. Thử nghiệm trên 125 người tham gia cho phép xác định chính xác khoảng 7% danh tính.

Các thí nghiệm khác tập trung vào dữ liệu Reddit nhằm xem mức độ nhận diện dựa trên sở thích giải trí. Khi người dùng thảo luận về phim trong nhiều cộng đồng khác nhau, mô hình có thể ghép các bình luận lại để suy đoán danh tính. Nếu một người chỉ nhắc tới một bộ phim, khoảng 3,1% tài khoản có thể bị nhận diện với độ chính xác 90%. Khi số phim được nhắc tới tăng lên hơn mười, tỷ lệ này có thể vượt 48%.

Kết quả nghiên cứu cho thấy các mô hình LLM có thể vượt qua nhiều phương pháp giải ẩn danh truyền thống. Nhờ khả năng phân tích văn bản tự do và tìm kiếm thông tin trên internet, các mô hình này có thể tổng hợp nhiều manh mối rời rạc để suy luận danh tính người dùng. Các nhà nghiên cứu cảnh báo khả năng này có thể bị khai thác cho nhiều mục đích, từ theo dõi hoạt động trực tuyến, xây dựng hồ sơ quảng cáo chi tiết đến triển khai các hình thức lừa đảo nhắm mục tiêu.

Các tin khác

Thực phẩm nào giúp giải rượu bia?

Tôi hay nhậu nhẹt, khó từ chối rượu bia trong các cuộc nhậu, vậy có thực phẩm nào giúp giải rượu bia hiệu quả mà tiện lợi? (Tuấn, 41 tuổi, Hà Nội)

Khởi tố giám đốc Nguyễn Thị Thanh Hiên

Kết quả điều tra xác định, bị can Nguyễn Thị Thanh Hiên đã thực hiện hành vi không xuất hóa đơn khi bán hàng và không kê khai thuế đối với số tiền hơn 4,8 tỷ đồng.

Hé lộ thu nhập của lãnh đạo ACV, Vinaconex vừa bị bắt

Dữ liệu từ báo cáo tài chính các năm qua cho thấy, các lãnh đạo tại ACV, Vinaconex nhận thù lao và tiền lương lên tới hàng tỷ đồng mỗi năm. Bốn lãnh đạo cấp cao của 2 doanh nghiệp này vừa bị Cơ quan Cảnh sát điều tra - Bộ Công an bắt tạm giam, để điều tra sai phạm liên quan hoạt động đấu thầu.

Cứ 3 giây lại có 1 người bị đột quỵ, bác sĩ nhắc nhở: Thà ăn thêm thịt còn hơn ăn nhiều 5 thực phẩm này

Đột quỵ đã không còn là căn bệnh xa lạ với nhiều người. Nó xuất hiện phổ biến ở người trung niên và cao tuổi, tuy nhiên trong những năm gần đây, số bệnh nhân đột quỵ trẻ ngày một tăng. Điều này làm dấy lên hồi chuông cảnh báo về những thói quen sinh hoạt hằng ngày có thể âm thầm gây hại sức khỏe.

Lá phiếu của những cử tri đặc biệt

Cụ ông 98 tuổi vẫn đi bỏ phiếu, sinh viên lần đầu trở thành cử tri, bệnh nhân được mang thùng phiếu phụ tới nhà... quyền bầu cử đang được bảo đảm cho mọi công dân.

Mua đất nông nghiệp bằng giấy viết tay có được cấp sổ đỏ?

Bộ Nông nghiệp và Môi trường cho biết, pháp luật đất đai hiện hành đã quy định cụ thể việc cấp sổ đỏ lần đầu cho hộ gia đình, cá nhân đang sử dụng đất không có giấy tờ về quyền sử dụng mà không vi phạm pháp luật về đất đai, không thuộc trường hợp đất được giao không đúng thẩm quyền tại Điều 138 của Luật Đất đai.