Question 1

Những định dạng hình ảnh nào được hỗ trợ?

Accepted Answer

JPG, PNG, WebP, và BMP. Bất kỳ định dạng nào mà trình duyệt của bạn có thể giải mã bằng Image API tiêu chuẩn đều nên hoạt động. Đối với ảnh HEIC từ iPhone, hãy chuyển đổi sang JPG trước bằng công cụ HEIC to JPG.

Question 2

Tại sao lần chạy đầu tiên chậm?

Accepted Answer

Tesseract cần khoảng 4 MB mã công cụ được biên dịch và 4 MB dữ liệu mô hình ngôn ngữ trong lần sử dụng đầu tiên. Cả hai đều được lưu vào bộ nhớ đệm bởi trình duyệt của bạn, vì vậy các lần chạy tiếp theo bắt đầu trong chưa đầy một giây. Việc nhận dạng thường mất 2–10 giây cho một ảnh chụp màn hình điển hình và tỷ lệ gần đúng với kích thước hình ảnh.

Question 3

Nó chính xác đến mức nào?

Accepted Answer

Trên văn bản được in sạch ở 300 DPI hoặc cao hơn, độ chính xác thường là 95%+. Trên ảnh chụp màn hình điện thoại của các trang web, độ chính xác thường tốt nhưng có thể bỏ sót các yếu tố UI nhỏ. Trên ảnh độ phân giải thấp, quét có nhiễu, hoặc chữ viết tay, độ chính xác giảm đáng kể. Chúng tôi sử dụng dữ liệu ngôn ngữ Tesseract nhanh — cân bằng tốt giữa tốc độ và độ chính xác.

Question 4

Nó có thể xử lý văn bản không phải tiếng Anh không?

Accepted Answer

Có — chọn ngôn ngữ phù hợp từ bộ chọn. Lần chạy OCR đầu tiên bằng ngôn ngữ đó tải xuống mô hình (3–14 MB) và lưu vào bộ nhớ đệm sau đó. Các ngôn ngữ được hỗ trợ bao gồm Hàn, Trung (Giản thể và Phồn thể), Nhật, Ả Rập, Hindi, Tây Ban Nha, Pháp, Đức, Bồ Đào Nha, Ý, Nga, và hơn thế nữa. Hình ảnh đa ngôn ngữ hoạt động tốt nhất khi bạn chọn ngôn ngữ chủ đạo.

Question 5

Còn chữ viết tay thì sao?

Accepted Answer

Nhận dạng chữ viết tay yếu. Tesseract được đào tạo trên văn bản được in và gặp khó khăn với chữ viết nghiêng hoặc lộn xộn. Chữ viết tay khối dễ đọc tạo ra kết quả có thể sử dụng nhưng không hoàn hảo; chữ viết nghiêng thường không hoạt động chút nào.

Question 6

Bạn có lưu hình ảnh của tôi hoặc văn bản được trích xuất không?

Accepted Answer

Không. Chúng tôi không lưu các hình ảnh bạn thả hoặc văn bản OCR tạo ra. Mọi thứ bị loại bỏ khi bạn đóng hoặc làm mới tab — không có log, không có bản ghi ở phía chúng tôi về những gì bạn đã OCR. Bạn có thể xác minh bằng công cụ nhà phát triển của trình duyệt.

Hình ảnh sang Văn bản — OCR trong trình duyệt của bạn

Mẹo để có kết quả tốt nhất

Ví dụ

Lỗi và cạm bẫy thường gặp