Question 1

Format gambar apa yang didukung?

Accepted Answer

JPG, PNG, WebP, dan BMP. Format apa pun yang dapat didekode peramban Anda dengan Image API standar harus bekerja. Untuk foto HEIC dari iPhone, konversi ke JPG terlebih dahulu dengan alat HEIC to JPG.

Question 2

Mengapa proses pertama lambat?

Accepted Answer

Tesseract membutuhkan sekitar 4 MB kode mesin yang dikompilasi dan 4 MB data model bahasa pada penggunaan pertama. Keduanya di-cache oleh peramban Anda, sehingga proses berikutnya dimulai dalam waktu kurang dari satu detik. Pengenalan itu sendiri biasanya membutuhkan 2–10 detik untuk tangkapan layar tipikal dan skala kira-kira dengan ukuran gambar.

Question 3

Seberapa akurat?

Accepted Answer

Pada teks tercetak bersih pada 300 DPI atau lebih tinggi, akurasi biasanya 95%+. Pada tangkapan layar ponsel dari situs web, akurasi biasanya baik tetapi dapat melewatkan chrome UI kecil. Pada foto resolusi rendah, pindaian dengan noise, atau tulisan tangan, akurasi turun signifikan. Kami menggunakan data bahasa Tesseract cepat — keseimbangan baik antara kecepatan dan akurasi.

Question 4

Bisakah menangani teks non-Inggris?

Accepted Answer

Ya — pilih bahasa yang sesuai dari pemilih. Proses OCR pertama dalam bahasa itu mengunduh model (3–14 MB) dan men-cache-nya setelahnya. Bahasa yang didukung termasuk Korea, Cina (Sederhana dan Tradisional), Jepang, Arab, Hindi, Spanyol, Prancis, Jerman, Portugis, Italia, Rusia, dan lainnya. Gambar bahasa campuran bekerja paling baik saat Anda memilih bahasa dominan.

Question 5

Bagaimana dengan tulisan tangan?

Accepted Answer

Pengenalan tulisan tangan lemah. Tesseract dilatih pada teks tercetak dan berjuang dengan tulisan kursif atau berantakan. Tulisan tangan blok yang terbaca menghasilkan hasil yang dapat digunakan tetapi tidak sempurna; kursif biasanya tidak bekerja sama sekali.

Question 6

Apakah Anda menyimpan gambar saya atau teks yang diekstrak?

Accepted Answer

Tidak. Kami tidak menyimpan gambar yang Anda letakkan atau teks yang dihasilkan OCR. Semuanya dibuang saat Anda menutup atau menyegarkan tab — tidak ada log, tidak ada catatan di pihak kami tentang apa yang Anda OCR. Anda dapat memverifikasi dengan alat pengembang peramban Anda.

Gambar ke Teks — OCR di Peramban Anda

Tips untuk hasil terbaik

Contoh

Kesalahan umum dan jebakan