Một đêm tháng 2/2021, Mark, 40 tuổi sống ở Mỹ, nhận thấy điểm bất thường trên vùng háng của đứa con trai mới biết đi. Ông và vợ định đưa con tới bệnh viện, nhưng phòng khám không làm việc vào cuối tuần và đang trong Covid-19, nên ông quyết định gửi ảnh cho bác sĩ chẩn đoán trước. Qua các bức ảnh, bác sĩ đã kê đơn thuốc để giúp giảm vết sưng. Thế nhưng, vợ chồng ông không biết chúng đã bị AI của Google thu thập và phân tích.
Mark cho biết ông sử dụng và phụ thuộc vào nhiều dịch vụ Google như Gmail, đồng bộ lịch với Google Calendar, sử dụng điện thoại Android và lưu trữ ảnh trên Google Photos, thậm chí mua gói cước mạng di động ảo Google Fi.
Hai ngày sau khi gửi ảnh con trai đến bác sĩ, smartphone của Mark hiện thông báo: "Tài khoản của bạn bị vô hiệu hóa vì nội dung có hại, vi phạm nghiêm trọng chính sách của Google và có thể chứa nội dung bất hợp pháp", cũng như "lạm dụng và bóc lột tình dục trẻ em".
Ban đầu, Mark tỏ ra bối rối, sau đó nhớ ra bức ảnh đã chụp con trai. "Ôi trời, có lẽ Google tưởng đó là ảnh khiêu dâm trẻ em", ông nghĩ.
Ông từng làm kỹ sư phần mềm phụ trách các ứng dụng kiểm duyệt nội dung, do đó, ông nghĩ các hệ thống như vậy sẽ biết cách phân loại đâu là nội dung cần gắn cờ, đâu là nội dung hợp pháp. Ông gửi kiến nghị lên Google, giải thích bệnh của con trai và lý do chụp ảnh.
Trong giai đoạn đó, hàng loạt dịch vụ Google mà Mark sử dụng bị tê liệt, bị xóa email, số liên lạc của bạn bè và đồng nghiệp, ảnh những năm tháng đầu đời của con trai lưu trên Google Drive. Ông cũng không nhận được mã bảo mật để đăng nhập tài khoản và nhiều vấn đề khác. "Bạn càng cho nhiều trứng trong một giỏ, giỏ càng dễ bị vỡ", Mark nói.
Vài ngày sau, Google trả lời họ sẽ không khôi phục tài khoản nhưng không giải thích gì thêm.
Rắc rối với không dừng ở đó. Tháng 12/2021, ông nhận được thông báo điều tra từ Sở cảnh sát San Francisco cùng lệnh khám xét nhà. Một điều tra viên yêu cầu mọi thứ trong tài khoản của Mark, như lịch sử tìm kiếm trên Internet, lịch sử vị trí, tin nhắn, các tài liệu, ảnh, video nào đang lưu trữ trên dịch vụ Google. Thời gian tìm kiếm liên quan đến "bóc lột trẻ em" diễn ra trong vài tháng.
Đến tháng 2, điều tra viên Nicholas Hillard kết luận Mark không phạm tội. "Tôi xác định sự việc không đủ yếu tố cấu thành tội phạm và không có vụ vi phạm nào xảy ra", Hillard viết trong báo cáo. Mark tiếp tục gửi kháng nghị lên Google kèm báo cáo của cảnh sát nhưng vô ích. Google thông báo tài khoản của ông sẽ bị xóa vĩnh viễn.
Mark không phải là trường hợp duy nhất. Cassio, sống ở Texas, cũng chụp ảnh con trai một tuổi mình bị nhiễm trùng ở bộ phận nhạy cảm cho bác sĩ và tài khoản Google của ông cũng bị khóa. "Tôi đang trong quá trình mua nhà và ký hàng loạt tài liệu kỹ thuật số. Chúng được lưu trên Gmail nhưng sau đó bị khóa. Thật đau đầu", Cassio chia sẻ.
Cách Google gắn cờ hình ảnh
Hàng triệu hình ảnh với nội dung trẻ em bị bóc lột hoặc lạm dụng tình dục được các ông lớn công nghệ gắn cờ mỗi năm. Năm 2021, chỉ riêng Google đã đệ trình hơn 600.000 báo cáo về tài liệu lạm dụng trẻ em, vô hiệu hóa tài khoản của hơn 270.000 người dùng.
Công cụ đầu tiên được ngành công nghệ sử dụng để phát hiện nội dung khiêu dâm trẻ em là PhotoDNA, được Microsoft phát hành năm 2009. Đây là cơ sở dữ liệu ảnh có quy mô lớn được nhiều hãng công nghệ như Facebook sử dụng để đối sánh nhằm phát hiện ảnh vi phạm kể cả khi bị "băm" nhỏ.
Bước đột phá lớn hơn diễn ra năm 2018, khi Google ra công cụ riêng dựa trên AI để phát hiện lượng lớn ảnh có nội dung xấu về trẻ em trong thời gian ngắn, kể cả khi chúng chưa được đăng lên mạng. Không chỉ tìm thấy những hình ảnh về trẻ bị lạm dụng đã biết, nó còn phát hiện nạn nhân vô danh và đề xuất đến chính quyền để giải cứu. Facebook sau đó cũng dùng công cụ này.
Với các hình ảnh tải lên như của Mark và Cassio, hệ thống của Google lập tức phân tích. Theo Jon Callas, chuyên gia công nghệ tại tổ chức tự do dân sự kỹ thuật số Electronic Frontier Foundation, quá trình này gọi là Quét xâm nhập. "Đây chính xác là cơn ác mộng mà tất cả chúng ta đều lo ngại. Họ quét album ảnh gia đình bạn, sau đó bạn gặp rắc rối", Callas nói.
Sau khi quét, AI gắn cờ các nội dung nghi ngờ. Một nhân viên kiểm duyệt nội dung của Google sẽ xem xét các bức ảnh hoặc video này để xác định xem chúng có thật sự vi phạm không. Nếu có, tài khoản Google sẽ bị khóa, còn nội dung vi phạm có thể gửi đến CyberTipline, một tổ chức phi lợi nhuận thuộc Trung tâm quốc gia về trẻ em mất tích và bị bóc lột.
Theo Fallon McNulty, người quản lý CyberTipline, tổ chức này nhận được 29,3 triệu báo cáo vào 2021, tức khoảng 80.000 báo cáo mỗi ngày. Hầu hết chúng là các bức ảnh đã có trên Internet, do đó đội ngũ 40 nhân sự của CyberTipline tập trung vào các bức ảnh mới, phân tích và gửi đến cơ quan thực thi pháp luật. Năm ngoái, tổ chức này cảnh báo các cơ quan chức năng về "hơn 4.260 nạn nhân tiềm năng là trẻ em mới", gồm ảnh của Mark và Cassio, dù họ không có mục đích xấu.
Kate Klonick, Giáo sư luật tại Đại học St. John, cho rằng việc xác định hành vi của một người khi chia sẻ ảnh của mình lên các nền tảng trực tuyến là thách thức công nghệ. "Tình trạng nhầm lẫn rất dễ xảy ra, do đó các công ty cần bổ sung quy trình chặt chẽ hơn nhằm khôi phục tài khoản cho những người không có mục đích xấu", bà Klonick cho biết.
Carissa Byrne Hessick, giáo sư luật tại Đại học Bắc Carolina và là chuyên gia về tội phạm khiêu dâm trẻ em, cho rằng không phải tất cả ảnh trẻ em khỏa thân đều là ảnh khiêu dâm, bóc lột hoặc lạm dụng. Theo Hessick, Google nên bổ sung các ngữ cảnh cụ thể với ảnh trẻ em khi kiểm duyệt qua AI, đồng thời đội ngũ kiểm duyệt là con người cũng cần theo dõi kỹ hơn các bức ảnh khi gắn cờ.
Google không đưa ra bình luận về các trường hợp cụ thể của Mark và Cassio. "Các tài liệu lạm dụng tình dục trẻ em là đáng ghê tởm. Chúng tôi cam kết ngăn chặn việc phát tán chúng trên các nền tảng của mình", đại diện Google cho biết.
(theo New York Times)