Mô tả đánh giá đã được cập nhật chi tiết hơn tại: https://aihub.vn/competitions/214#learn_the_details-evaluation
Cụ thể như sau:
Kết quả sẽ được đánh giá dựa trên chỉ số CER (Character Error Rate). CER đại diện cho phần trăm ký tự trong văn bản của tệp grouth truth bị dự đoán không chính xác. CER càng thấp thì mô hình nhận diện càng chính xác.
Trong đó, nhãn được tạo nên với các tiêu chí như sau:
Nhãn được tạo trên mức từ đơn của Tiếng Việt
Nhãn có phân biệt ký tự hoa và ký tự thường
Nhãn bao gồm các ký tự đặc biệt như dấu ".", ":", "-",…
Ví dụ:
Thiết bị vệ sinh - Phòng tắm - Nhà bếp sẽ được gán thành "Thiết", "bị", "vệ", "sinh", "-", "Phòng, "tắm", "-", "Nhà", "bếp"
ĐT: 012345678 sẽ được gán thành "ĐT:" và "012345678"
Mô tả tiếp tục được cập nhật chi tiết hơn về cách tính S, D, I trong công thức tính CER
Posted by: sangdv @ April 13, 2022, 2 p.m.