Công nghệ

AI lõi ‘Make in Vietnam’ của CMC được xếp hạng Top 12 thế giới

Mo hinh AI.jpg
Chuyển đổi AI tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu. Ảnh: Minh họa

Mới đây, Viện Ứng dụng Công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, đạt Top12 thế giới và Top 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Ông Đặng Minh Tuấn, Viện trưởng CMC ATI, chia sẻ: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Tự hào là chỉ trong thời gian ngắn, team có thể đạt thứ hạng cao, sánh vai các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

Trong bối cảnh chuyển đổi số, chuyển đổi AI tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị.

Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…).

Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

CMC AI.jpg

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín,  được tổ chức bởi Trung tâm Thị giác Máy tính thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Khởi xướng từ 2011, luôn đồng hành cùng Hội nghị Quốc tế về Phân tích và nhận dạng văn bản ICDAR– một trong những diễn đàn lớn nhất thế giới về phân tích tài liệu và thị giác máy tính, cuộc thi đã trở thành một sự kiện quan trọng, thu hút các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và công ty công nghệ uy tín như Đại học Tsinghua, Hyundai Motor Group, và Tencent…

Các nhiệm vụ của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Các tin khác

Biển Đông sắp đón áp thấp nhiệt đới

Chiều nay (3/7), một vùng áp thấp vừa hình thành ở khu vực phía đông bắc của đảo Luzon của Philippines, ngay sát Biển Đông. Dự báo trong đêm nay và ngày mai (4/7), vùng áp thấp này có thể mạnh lên thành áp thấp nhiệt đới, hoạt động trên Biển Đông.

Giá xăng dầu đồng loạt giảm

Trong kỳ điều hành giá xăng dầu chiều nay 3.7, giá các mặt hàng xăng dầu đồng loạt giảm so với giá điều hành ngày 1.7.

Khi thị trường biến động - cơ hội để BSR tăng tốc

Thị trường dầu mỏ thế giới nửa đầu năm 2025 tiếp tục biến động do căng thẳng địa chính trị leo thang, đặc biệt là xung đột vũ trang giữa Iran và Israel khiến nguồn cung bị gián đoạn, chuỗi cung ứng rối loạn và giá dầu Brent biến động mạnh theo chu kỳ ngắn. Tại Việt Nam, các nhà máy lọc dầu, trong đó có Nhà máy Lọc dầu (NMLD) Dung Quất do Công ty cổ phần Lọc hóa dầu Bình Sơn (BSR) vận hành, chịu sức ép kép từ thị trường nhập khẩu giá rẻ và sự bất ổn giá nhiên liệu.

Tưởng mắc ung thư dạ dày, ai ngờ bị một dạng rối loạn tâm thần

Đau bụng kéo dài, đi khám khắp nơi, được chẩn đoán viêm dạ dày, uống theo bác sĩ kê đơn nhưng bệnh không khỏi. Bệnh nhân được thực hiện thủ thuật cắt dạ dày nhưng vẫn không hết đau. Khi đến với Viện Sức khỏe tâm thần, Bệnh viện Bạch Mai thì hóa ra bị rối loạn dạng cơ thể.

Ngày thứ 2 vận hành chính quyền 2 cấp tại xã đông dân nhất TP.HCM: Bốc số hơn 5.000, hoàn thành thủ tục chỉ 30 phút, người dân bất ngờ

Sáng 2/7, UBND xã Bà Điểm (TP Hồ Chí Minh) tiếp tục đón lượng lớn người dân đến làm thủ tục hành chính trong ngày thứ hai thực hiện mô hình chính quyền hai cấp. Xã Bà Điểm - địa phương đông dân nhất TP.HCM sau sáp nhập - đã ghi nhận số lượng hồ sơ tăng cao ngay từ ngày đầu.

Chuyện lạ: Tuyết rơi ở sa mạc Atacama, nơi khô hạn nhất Trái đất

Một trận tuyết rơi hiếm hoi ở sa mạc Atacama, Chile, nơi khô hạn nhất trên Trái Đất đã làm dừng hoạt động của một trong những hệ thống kính thiên văn hàng đầu thế giới. Biến đổi khí hậu có thể khiến đài quan sát này phải đối mặt với nhiều hiện tượng thời tiết khắc nghiệt như thế này trong tương lai.

Chân dung nhân sự lãnh đạo tỉnh Hưng Yên mới

Bộ Chính trị quyết định thành lập Đảng bộ tỉnh Hưng Yên trực thuộc Ban Chấp hành Trung ương Đảng trên cơ sở hợp nhất 2 đảng bộ tỉnh: Hưng Yên và Thái Bình. Bộ Chính trị cũng chỉ định Ban Chấp hành, Ban Thường vụ, Bí thư Tỉnh ủy Hưng Yên.