Tại hội nghị chuyên về trí tuệ nhân tạo ECAI 2024, kỹ sư đến từ Việt Nam mang đến giải pháp AI Việt giúp nhận diện bảng biểu dưới hai giây, đưa bảng biểu từ ảnh vào file Excel có thể nhận diện với tốc độ 40 khung hình/giây, khác biệt 2% so với dữ liệu gốc.
Giải pháp AI Việt tốc độ nhanh gấp 4 lần so với giải pháp quốc tế
Nhóm nghiên cứu đến từ Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) đã công bố giải pháp tự động trích xuất cấu trúc bảng biểu trong thời gian thực, giúp đẩy tốc độ trích xuất thông tin nhanh hơn 4 lần so với các giải pháp hiện có trên thị trường trong nước và quốc tế.
Theo đại diện nhóm nghiên cứu, giải pháp trích xuất dữ liệu từ bảng biểu của Viettel AI có tốc độ xử lý lên tới 40 FPS (khung hình/giây) trong một số trường hợp. Đặc biệt, mặc dù đẩy mạnh tốc độ, độ chính xác vẫn được đảm bảo tương đương các giải pháp hiện có, với độ khác biệt chỉ khoảng 2% trên các tập dữ liệu chuẩn.
Giảm thiểu nhập liệu thủ công, tối ưu độ chính xác
Tự động trích xuất dữ liệu là việc sử dụng công nghệ, như trí tuệ nhân tạo (AI) và nhận diện ký tự quang học (OCR) để tự động lấy thông tin từ các nguồn như văn bản, hình ảnh, hoặc tài liệu scan và chuyển đổi chúng thành định dạng dễ xử lý, ví dụ như file Excel. Đây là nghiệp vụ được thực hiện nhiều trong ứng dụng văn phòng số, hỗ trợ đắc lực cho quá trình số hóa giấy tờ vật lý tại các tổ chức.
Tuy nhiên trong nhiều năm, thách thức của các giải pháp là chưa thể xử lý nhanh hình ảnh chứa bảng biểu, do sự đa dạng trong cấu trúc bảng, như có bảng không chứa viền, có nhiều ô trống, các ô kích thước khác nhau.
“Trong khi chữ viết đã được xử lý khá hiệu quả, việc trích xuất chính xác thông tin từ bảng biểu trong tài liệu đến nay vẫn là bài toán khó”, đại diện Viettel AI đánh giá. “Tự động hóa quá trình này giúp giảm bớt công việc nhập liệu thủ công, tăng độ chính xác và tốc độ xử lý văn bản”.
Hướng đến những cải thiện ưu việt hơn trong tương lai
Nhóm cho biết đã nghiên cứu để giảm quá trình xử lý xuống một giai đoạn thay vì nhiều giai đoạn như cách truyền thống, từ đó giúp xử lý loại bảng nhiều hàng, cột nhanh hơn. Ngoài ra, giải pháp AI Việt nhận diện bảng biểu cũng làm giảm độ phức tạp của quy trình xử lý, giúp tiết kiệm bộ nhớ và quy trình huấn luyện mô hình AI.
Đại diện nhóm nghiên cứu cũng cho biết, hiện công nghệ này đã được tích hợp vào Viettel IDP – giải pháp xử lý hồ sơ thông minh do Viettel AI nghiên cứu và phát triển. Viettel IDP có khả năng tự động bóc tách thông tin dạng ảnh với tốc độ dưới 2 giây/trang tài liệu, nhanh hơn 60-80 lần so với nhập liệu thủ công, độ chính xác lên tới 90%, giúp người dùng tiết kiệm 80% thời gian phê duyệt hồ sơ.
Theo các chuyên gia, tính hiệu quả của công nghệ sẽ cần được đánh giá thêm trong quá trình sử dụng thực tế. Trong thử nghiệm với hình ảnh chứa hai bảng biểu, giải pháp có thể xuất dữ liệu cùng cấu trúc bảng lập tức, với cấu trúc bảng và số liệu chuẩn. Tuy nhiên, vẫn còn một số điểm cần cải thiện, như dấu “>=” trong cách viết thông thường chưa được tái hiện chính xác.
“Công nghệ được công bố tại Hội nghị ECAI 2024 là bước đầu trong quá trình tăng tốc độ xử lý của giải pháp, hướng đến mục tiêu xử lý thông tin không chỉ dưới hai giây mà là tức thì”, đại diện nhóm cho biết.