Cách ngăn Facebook lấy dữ liệu để huấn luyện AI

Người dùng Internet có thể xóa thông tin cá nhân đang bị Meta thu thập cho việc đào tạo mô hình AI tạo sinh.

23:00 03-09-2023 2023-09-03 23:00:00 +0700

Các mô hình AI hiện nay cần nguồn dữ liệu đầu vào khổng lồ về "học". Những dữ liệu này được thu thập từ nhiều nguồn trên mạng như hình ảnh, bài viết, bình luận... và trong đó có cả thông tin cá nhân của người dùng mạng xã hội.

Meta cung cấp cho người dùng tùy chọn thay đổi hoặc xóa bất kỳ dữ liệu cá nhân nào của họ mà công ty sử dụng để đào tạo ngôn ngữ lớn và mô hình AI liên quan. Theo cập nhật mới nhất, người dùng có thể vào trang trợ giúp, truy cập mục Quyền của chủ thể dữ liệu đối với AI tạo sinh.

Tại đây có ba lựa chọn gồm: "Tôi muốn truy cập, tải xuống hoặc sửa thông tin cá nhân bất kỳ mà các bên thứ ba cung cấp dùng cho AI tạo sinh"; "Tôi muốn xóa mọi thông tin cá nhân mà các bên thứ ba cung cấp để dùng cho AI tạo sinh" và "Ý kiến khác".

Logo Meta hiển thị trên smartphone, phía sau là ánh sáng đèn LED của một bo mạch chủ. Ảnh: Reuters

Với tùy chọn đầu tiên, người dùng có thể tải về dữ liệu đã bị "bên thứ ba" thu thập và xem xét trước khi đồng ý cho Meta dùng chúng để đào tạo AI. Trong khi đó, tùy chọn thứ hai yêu cầu nền tảng xóa những gì đang lưu trữ. Nếu có yêu cầu khác, người dùng cần cung cấp họ tên, quốc gia cư trú và email cùng ý kiến của mình, sau đó gửi đi.

Sau khi chọn một trong ba tùy chọn, họ cũng cần vượt qua bài kiểm tra kiểm tra bảo mật. Tuy nhiên, theo CNBC, một số người phản ánh không thể hoàn thành biểu mẫu vì "có vẻ như lỗi phần mềm".

Dữ liệu nào đang được Meta thu thập?

Meta định nghĩa thông tin của bên thứ ba là dữ liệu "được cung cấp công khai trên Internet hoặc các nguồn được cấp phép". Hãng cho biết loại thông tin này "có thể đại diện cho một số trong số hàng tỷ mẫu dữ liệu" được sử dụng để đào tạo AI bằng cách dùng những gì thu thập được cho tổng hợp, dự đoán và tạo ra nội dung mới.

Trong bài đăng blog ngày 30/8, Meta cho biết họ lấy thông tin công khai này, bên cạnh việc dùng dữ liệu được cấp phép từ các đối tác. "Để dạy mô hình theo cách hiệu quả, chúng tôi cần một lượng dữ liệu lớn. Do đó, chúng tôi dùng kết hợp các nguồn khác nhau trong quá trình đào tạo. Những nguồn này gồm thông tin công khai trên mạng, thông tin được cấp phép, cũng như thông tin từ các sản phẩm và dịch vụ của Meta", bài viết nêu.

Trong quá trình thu thập, Meta có thể lấy được cả thông tin cá nhân. Chẳng hạn một bài viết công khai có thể chứa thông tin tác giả. Công ty nói trong quá trình lấy dữ liệu, quyền riêng tư của người dùng được đảm bảo và có đội ngũ chuyên trách để làm điều này.

Meta hiện vận hành mô hình ngôn ngữ lớn LLaMA, được công bố đầu năm nay. Nó hoạt động dưới dạng mở, cho phép nhà nghiên cứu và tổ chức chính phủ, xã hội, học viện dùng miễn phí. Phát ngôn viên Meta cho biết phiên bản LLaMA thế hệ mới, LLaMA 2, chưa sử dụng dữ liệu của người dùng trên các nền tảng như Facebook, Instagram của Meta để huấn luyện AI.

"Tùy vào nơi sinh sống, mọi người có thể thực hiện quyền làm chủ dữ liệu, có thể phản đối chúng tôi khai thác một số dữ liệu nhất định để đào tạo AI", phát ngôn viên Meta nói. "Họ có quyền biết thông tin của họ đang được chúng tôi sử dụng thế nào".

Đến nay, hầu hết công ty công nghệ như Meta, Microsoft, Google hay OpenAI vẫn thu thập dữ liệu công khai trên Internet để phục vụ quá trình huấn luyện AI. Tuy nhiên, giới chuyên môn nhiều lần đặt câu hỏi về việc lượng lớn thông tin thu được đang sử dụng thế nào.

Tuần trước, liên minh gồm các cơ quan bảo vệ dữ liệu từ Anh, Canada, Thụy Sĩ và một số quốc gia khác đưa ra tuyên bố chung rằng các công ty công nghệ lớn như Meta, Alphabet, ByteDance, X, Microsoft cần phải tuân theo luật bảo vệ dữ liệu và quyền riêng tư tùy theo những nơi đang hoạt động. Nhóm khuyến cáo người dùng cần có ý thức cao hơn trong việc kiểm soát và bảo vệ thông tin đưa lên Internet.

Cách ngăn Facebook lấy dữ liệu để huấn luyện AI

Đọc thêm

Tàu Cát Linh - Hà Đông lập kỷ lục mới với gần 56.000 khách/ngày

Người nghỉ lễ quay lại TP HCM, giao thông ùn tắc nhiều nơi

Mua nhà trong ngõ: Sau hoang mang vì dính quy hoạch, nữ nhân viên vỡ oà hạnh phúc vì nhà trong ngõ bỗng ra mặt đường

Vụ giao đất không đấu giá: Mường Thanh Quảng Nam đã nộp 18,6 tỉ đồng

Môi giới nhà đất tận dụng ngày nghỉ Lễ để bán hàng

NĐT cá nhân và các tổ chức trong nước giao dịch thế nào trước kỳ nghỉ lễ 2/9?

Chưa hết nghỉ lễ, cửa ngõ Thủ đô đã ken đặc người và xe

Kido lãi nghìn tỷ từ thoái vốn KidoFoods

7 cài đặt mặc định nên thay đổi trên iPhone

Vụ ô tô tông hàng loạt xe máy: Trách nhiệm khi giao xe cho người 16 tuổi điều khiển?

Phó Thủ tướng yêu cầu điều tra nguyên nhân vụ cháy 4 người chết tại Bình Thuận

Tác giả đường "né" tử thần

Dư địa giảm lãi suất không còn nhiều, nhà điều hành sẽ dùng công cụ khác để hỗ trợ nền kinh tế

Vận tải cơ C-17 của Mỹ tới Hà Nội

Giá đường lập đỉnh 12 năm, Mía đường Sơn La (SLS) muốn chia cổ tức 10.000 đồng/cp

Ngày 3/9, xảy ra 32 vụ TNGT đường bộ, 20 người chết

Chuỗi bán nệm lớn nhất cả nước thoát lỗ

Cận cảnh tuyến đường Đông - Tây 23 km trị giá gần 2.000 tỉ đồng

Tháng Ngâu, thị trường bất động sản vẫn sôi động

Cuối năm 2023, nên đầu tư phân khúc bất động sản nào?

Đối tác

Tin nổi bật

Chủ tịch Vietravel tâm tư về giới startup: Hãy nghĩ kỹ trước khi "đập đi xây lại" mô hình kinh doanh, vì thất bại nhiều quá thì "không người mẹ nào nuôi được mãi"

Chuyên gia Phạm Chi Lan chỉ ra 4 điểm yếu của các nhà sáng lập Việt: Nhiều startup cho rằng xuất khẩu được mới "oai", trong khi thị trường nội còn khó hơn ngoại

Thị trường vốn Đông Nam Á: Việt Nam chỉ có duy nhất một thương vụ IPO, hút 37 triệu USD trong 10 tháng đầu năm

Căn hộ sơ cấp Tp.HCM chạm mốc cao nhất gần nửa tỉ đồng mỗi m2, sức cầu toàn thị trường phía Nam “bật tăng” tăng 93% so với năm ngoái

TS Cấn Văn Lực: ‘Chỉ có người đầu tư, gửi tiền mới thích lãi kép, còn những người đi vay không ai thích’

LPBank bất ngờ muốn chuyển Trụ sở chính, sẽ mua 5% vốn cổ phần FPT

Phó Thống đốc NHNN: "Từ 1/1/2025, tài khoản ngân hàng không xác thực thông tin căn cước công dân bị dừng giao dịch"

Hậu bão chốt deal từ cả 5 Shark trên Shark Tank, doanh nghiệp "khắc tinh" của thuốc trừ sâu nhận tiếp bão doanh số, mở rộng phân phối ra 8 tỉnh thành

Lần đầu tiên trên Shark Tank: Shark Minh xuống "deal in kind" chứ không ‘in cash’, dùng quyền lợi của "cá mập" để làm Co-founder chứ không rót tiền

Trai Tây bỏ việc đi chu du thế giới, chọn Việt Nam khởi nghiệp chuỗi phòng tập cho người giàu, lên Shark Tank nhận được "mưa lời khen" kèm "mưa lời từ chối"

Cùng chuyên mục

Đọc thêm

Đối tác

Tin nổi bật