AI OCR hóa đơn VN: 5 giây/hóa đơn, accuracy 96% — phá vỡ rào cản nhập tay
Cách est-invoice dùng vision model trích xuất 14 trường từ hóa đơn VN (MST, số HĐ, ngày, items, VAT, tổng tiền) — kèm benchmark trên 1,000 hóa đơn thật từ 3 ngành.
Founder, NKKTech Group · CEO, est-invoice
Trong 100 SME Việt chúng tôi audit năm 2025, trung bình mỗi công ty mất 38 giờ/tháng chỉ để nhập tay hóa đơn từ ảnh chụp / PDF / email scan. Với SME 20 nhân viên, đó là gần 1 full-time kế toán làm việc phụ trợ — chi phí ẩn ~₫12-18 triệu/tháng.
est-invoice giải bài toán này bằng AI OCR chuyên cho hóa đơn VN. Trong bài này em mở toàn bộ kết quả benchmark trên 1,000 hóa đơn thật từ 3 ngành (sản xuất, thương mại, dịch vụ) — chi tiết accuracy theo từng trường, edge case, và cách bạn có thể chạy benchmark này trên dữ liệu của mình.
Bài toán cụ thể
Một hóa đơn VN điển hình có 14 trường cần extract:
- Mã số thuế (MST) bên bán
- Tên + địa chỉ bên bán
- Số hóa đơn (vd
0000123) - Mẫu số + ký hiệu hóa đơn (vd
1/001 - C25TAA) - Ngày phát hành
- Tên + MST + địa chỉ bên mua
- Hình thức thanh toán
- Danh sách items (tên, đơn vị, số lượng, đơn giá, thành tiền)
- Tổng tiền hàng (chưa thuế)
- Thuế suất GTGT (0% / 5% / 8% / 10%)
- Tiền thuế GTGT
- Tổng tiền thanh toán
- Mã CQT (nếu hóa đơn điện tử)
- Số seri / chữ ký số
Với phần mềm cũ kế toán phải gõ 14 trường × 200 hóa đơn/tháng = 2,800 ô data. Sai sót 2-5% là bình thường. Phát hiện sai khi đối chiếu thuế vào quý sau → mất thêm 2-4 giờ tracing.
Stack AI est-invoice dùng
est-invoice không dùng OCR truyền thống (Tesseract). Lý do: hóa đơn VN có quá nhiều biến thể (in laser, in nhiệt, ảnh chụp nghiêng, scan có bóng), và OCR chỉ nhận text, không hiểu cấu trúc.
Stack thực tế:
- Vision LLM (Claude 3.7 Sonnet) — nhận ảnh JPG/PNG hoặc PDF, trả về JSON 14 trường
- Schema validation Zod — reject output không hợp shape (MST 10/13 ký tự, ngày format, etc.)
- VN tax-rule layer — check rule TT 78/2021 + TT 200/2014 (mẫu số/ký hiệu phải đúng format, ngày <= hôm nay, tổng tiền = tiền hàng + thuế ± 1₫ rounding)
- Confidence scoring — mỗi trường có confidence 0-100; trường < 70 sẽ highlight để kế toán review
Benchmark — 1,000 hóa đơn thật, 3 ngành
Tháng 3-4/2026 chúng em chạy benchmark trên 3 tenant:
- Phúc Khang (sản xuất, 320 hóa đơn) — chủ yếu hóa đơn điện tử từ nhà cung cấp NVL
- Sao Mai (thương mại bán lẻ, 410 hóa đơn) — pha trộn ảnh chụp + scan máy in
- Đại Việt (dịch vụ tư vấn, 270 hóa đơn) — hầu hết PDF từ thầu phụ + nhà cung cấp dịch vụ
Accuracy tổng quan
Field-level accuracy trên 1,000 hóa đơn:
- MST bên bán: 99.2% (chỉ sai 8/1,000 — toàn case ảnh mờ)
- Số hóa đơn: 97.4%
- Ngày phát hành: 98.8%
- Tổng tiền thanh toán: 99.6% (sai 4/1,000, lệch < ₫1,000)
- Thuế suất GTGT: 96.1% (case khó: hóa đơn có items vừa 8% vừa 10%)
- Tiền thuế GTGT: 97.8%
- Items individual (tên + số lượng + đơn giá): 92.4% (khó nhất; ký tự đặc biệt + viết tắt)
Composite accuracy (tất cả 14 trường đúng hết): 87.3%. Tức là 87/100 hóa đơn được auto-post bút toán không cần review. 13/100 cần spot-check (system tự flag confidence < 70).
Tốc độ
- P50: 3.8 giây/hóa đơn
- P95: 6.2 giây/hóa đơn
- P99: 11.3 giây (chủ yếu là PDF nhiều trang)
Hóa đơn upload qua mobile (ảnh chụp): trung bình 4.6 giây từ shutter đến bút toán.
3 edge case khó
1. Hóa đơn in nhiệt mờ sau 6 tháng
Hóa đơn từ POS in giấy nhiệt sẽ phai sau 3-6 tháng. Vision LLM accuracy giảm còn ~78% trên ảnh phai. Khuyến nghị: chụp ngay khi nhận hàng, lưu cloud trước.
2. Hóa đơn 2 ngôn ngữ (Việt + Anh hoặc Nhật)
Một số NCC FDI in hóa đơn song ngữ. est-invoice xử OK miễn phần MST + số tiền là chữ Latin/số. Khuyến nghị: nếu khách thường có hóa đơn JP/EN, bật EXTRA_LOCALESflag trong settings để cải thiện accuracy item parsing.
3. Hóa đơn ghép nhiều page
PDF hóa đơn dài 3-5 trang (vd hóa đơn dịch vụ B2B có chi tiết hoạt động): system tự ghép thành 1 record, items lấy từ tất cả pages. Accuracy giảm ~3% so với 1-page invoices nhưng vẫn >90%.
Tự benchmark trên dữ liệu của bạn
Vào /settings/data-export → "AI Accuracy Benchmark". Upload 30-50 hóa đơn mẫu của công ty, đợi 5-10 phút, nhận report PDF với accuracy per-field của riêng bạn. Nếu < 90% composite, team em hỗ trợ fine-tune prompt riêng (free trial customers cũng được).
Tiết kiệm thực tế — số liệu từ 3 khách hàng
Sau 60 ngày dùng est-invoice OCR:
- Phúc Khang: thời gian nhập hóa đơn giảm từ 32h/tháng → 4.5h/tháng (giảm 86%)
- Sao Mai: giảm từ 28h → 5.2h (giảm 81%)
- Đại Việt: giảm từ 18h → 3.1h (giảm 83%)
Trung bình tiết kiệm 25 giờ/tháng cho kế toán — đủ để 1 kế toán full-time có thể chăm thêm 2-3 tenant thay vì 1.
Bắt đầu thử trong 5 phút
- Tạo trial 30 ngày miễn phí (không cần thẻ tín dụng)
- Vào
/expenses → New → Upload, chọn 1 ảnh hóa đơn của bạn - Đợi 5 giây, xem AI extract 14 trường → review → post bút toán
Hỏi gì thêm về OCR, em (Tony) sẵn sàng demo 1-on-1 qua Google Meet — đặt lịch tại cal.com/tony-nkktech.