Trong bối cảnh trí tuệ nhân tạo (AI) và mạng xã hội đang tạo ra một lượng dữ liệu khổng lồ vượt quá khả năng lưu trữ của các thiết bị ổ cứng, các nhà khoa học đang tìm đến những phương pháp phi truyền thống để bảo tồn thông tin.
Một nghiên cứu công bố trên tạp chí Science Advances đã mô tả thí nghiệm gây kinh ngạc cho giới mộ điệu âm nhạc: Băng cassette DNA.
Các nhà nghiên cứu từ Đại học Khoa học và Công nghệ Miền Nam (Trung Quốc) đã đưa DNA tổng hợp lên một dải băng nhựa, mã hóa dữ liệu vào các chuỗi dài gồm bốn bazơ nitơ của nó.
Trong hệ thống này, các tệp kỹ thuật số được chuyển đổi thành chuỗi A, T, C và G, vốn là bốn chữ cái DNA dùng để lưu trữ thông tin di truyền.
Những chuỗi này sẽ thay thế cho các mã nhị phân 0 và 1 mà máy tính truyền thống vẫn sử dụng.
Nhóm nghiên cứu đã in các sợi DNA tổng hợp ngắn thành những điểm siêu nhỏ trên một màng nhựa dẻo.
Sau đó, họ cắt và cuộn màng này thành một dải băng thanh mảnh có thể di chuyển trơn tru giữa các trục quay, tương tự như cơ chế của những cuộn băng cassette cổ điển.
Về mặt lý thuyết, định dạng này có thể chứa tới 36 petabyte dữ liệu trong một cuộn băng duy nhất, tương đương với khoảng 3 tỷ bài hát, thay vì chỉ vài chục bài như băng từ thông thường.
Theo giáo sư Jiang Xingyu, nhờ một lớp bảo vệ chứa các ion kẽm, dữ liệu có thể được bảo quản ở nhiệt độ phòng trong hơn 300 năm.
Nhóm đang đặt mục tiêu đẩy nhanh tốc độ đọc/ghi và hợp tác với các doanh nghiệp để thương mại hóa công nghệ này.
Cơn đại hồng thủy dữ liệu
Theo một ước tính, lượng hình ảnh, video, văn bản và các dữ liệu khác được tạo ra trên toàn thế giới đã đạt 181 zettabyte vào năm 2025, tương đương với khoảng 70 tỷ bộ phim độ phân giải cao dài hai tiếng.
Con số này đã tăng gấp đôi chỉ sau 4 năm với sự trỗi dậy của AI tạo sinh và sự bùng nổ nội dung trên mạng xã hội.
Dữ liệu được ví như "dầu mỏ của thế kỷ 21" vô giá đối với phát triển kinh tế và nghiên cứu khoa học.
Việc sử dụng khối lượng dữ liệu khổng lồ để huấn luyện có thể tạo ra các hệ thống AI mạnh mẽ, trong khi các nhà bán lẻ có thể phân tích lịch sử duyệt web và dữ liệu GPS để thấu hiểu thị hiếu khách hàng.
Tuy nhiên, phần lớn thông tin này hiện không được ghi lại.
"Các trung tâm dữ liệu được đưa vào vận hành trong tương lai sẽ chỉ có thể chứa được một vài phần trăm trong tổng lượng dữ liệu đang được tạo ra," Yoichiro Tanaka, giáo sư tại Đại học Tohoku, người từng phát triển ổ cứng tại Toshiba, nhận định.
Kim cương và công nghệ lượng tử
Chi phí là rào cản lớn nhất.
Các thiết bị như ổ cứng hay bộ nhớ flash tiêu tốn rất nhiều năng lượng và chỉ có tuổi thọ khoảng một thập kỷ, phát sinh thêm chi phí sửa chữa hoặc thay thế.
Vì vậy, các nhà nghiên cứu đang nỗ lực tìm cách lưu trữ lượng dữ liệu khổng lồ trong thời gian dài.
Một nhóm nghiên cứu tại Đại học Khoa học và Công nghệ Trung Quốc đã nhắm tới kim cương.
Trong bài báo đăng trên Nature Photonics năm 2024, các nhà nghiên cứu đã sử dụng tia laser để loại bỏ các nguyên tử carbon đơn lẻ khỏi những viên kim cương dài vài milimet.
Các lỗ hổng tạo ra được dùng để lưu trữ dữ liệu, sau đó được giải mã dựa trên mức độ sáng khác nhau của mỗi vị trí.
Với phương pháp này, một centimet khối kim cương có thể lưu trữ 1,85 terabyte dữ liệu với độ chính xác 99%.
Một chiếc đĩa dày 1,2mm, đường kính 12cm làm từ vật liệu này sẽ có dung lượng gấp khoảng 2.000 lần một đĩa Blu-ray cùng kích thước.
Đặc biệt, nhờ độ cứng và độ bền của kim cương, dữ liệu có thể được lưu trữ trong hàng triệu năm mà không cần bất kỳ biện pháp bảo quản đặc biệt nào.
Trong khi đó, các nhà nghiên cứu tại Đại học Chicago lại khai thác công nghệ lượng tử để lưu trữ hàng terabyte dữ liệu trong một tinh thể oxit 1mm chứa các ion đất hiếm.
Họ sử dụng tia cực tím để khiến các ion giải phóng điện tử, sau đó "bẫy" chúng vào các khiếm khuyết trong tinh thể để mã hóa dữ liệu.
Nguy cơ về một "Kỷ nguyên bóng tối kỹ thuật số"
Trái ngược với những phương tiện cổ xưa như đá hay giấy vốn có thể tồn tại hàng thiên niên kỷ nếu được bảo quản tốt, công nghệ hiện đại lại không phù hợp để lưu trữ dài hạn.
Các chuyên gia cảnh báo rằng thế kỷ 21 có thể bị hậu thế coi là "Kỷ nguyên bóng tối kỹ thuật số" (digital dark age) vì các hồ sơ dữ liệu bị thất lạc.
Để tránh điều này, nhân loại không chỉ cần những vật liệu lưu trữ bền bỉ mà còn cần những phương thức đọc dữ liệu lâu dài.
Đại diện Thư viện Quốc hội Nhật Bản (National Diet Library) bày tỏ sự lo ngại: "Cứ mỗi 3 đến 5 năm, một thế hệ thiết bị lưu trữ mới lại ra đời, và chúng ta không còn có thể sử dụng các thiết bị cũ để đọc hoặc ghi dữ liệu nữa.".
DNA, lưu trữ dữ liệu và tương lai
Mặc dù có dung lượng khổng lồ, cuộn băng cassette này vẫn rất chậm so với các thiết bị lưu trữ thông thường.
Trong buổi trình diễn, việc sao chép dữ liệu đến và đi từ dải băng mất hàng chục phút cho một tệp chỉ có kích thước vài trăm kilobytes.
Ngoài ra, việc tổng hợp các sợi DNA số lượng lớn vẫn còn rất đắt đỏ, và nhiều máy giải trình tự DNA vẫn là những thiết bị cồng kềnh trong các phòng thí nghiệm chuyên dụng.
Các nhà nghiên cứu hy vọng rằng khi chi phí công nghệ sinh học giảm xuống và các phản ứng hóa học nhanh hơn xuất hiện, việc lưu trữ DNA kiểu băng cassette sẽ trở thành một phương pháp thực tế để lưu trữ dữ liệu (archive data).
Nguồn: Nikkei, Earth


