Menampilkan dalam Bahasa Indonesia Ganti ke Inggris

Gambar ke Teks — OCR di Peramban Anda

Ekstrak teks dari foto, tangkapan layar, dan dokumen yang dipindai. Tesseract OCR berjalan sepenuhnya di peramban Anda — tidak ada yang diunggah.

Letakkan gambar di sini atau
  1. Letakkan atau jelajahi satu atau banyak gambar — JPG, PNG, WebP, atau BMP.
  2. Pilih bahasa jika teks Anda bukan bahasa Inggris — proses pertama dalam bahasa itu mengunduh model (3–14 MB) dan men-cache-nya di peramban Anda untuk lain kali.
  3. Klik Ekstrak semua. Proses pertama mengunduh kira-kira 8 MB mesin OCR dan data bahasa dari situs ini (di-cache oleh peramban Anda dan digunakan ulang di setiap gambar dalam batch).
  4. Teks yang dikenali dari gambar pertama muncul di pratinjau di bawah. Unduh teks setiap gambar secara individual dari barisnya, salin semuanya ke clipboard, atau ambil satu .txt gabungan dengan output setiap file dipisahkan oleh header.
Apa fungsinya?

OCR (Optical Character Recognition) mengubah piksel yang terlihat seperti teks menjadi teks sebenarnya. Alat ini menjalankan Tesseract — mesin OCR open-source yang dikelola oleh Google — dikompilasi ke WebAssembly. Bekerja paling baik pada teks tercetak; pengenalan tulisan tangan lebih lemah.

Tips untuk hasil terbaik

  • Kontras tinggi antara teks dan latar belakang.
  • Pindaian tidak miring — putar gambar terlebih dahulu dengan Image Cropper jika miring atau terbalik.
  • 300 DPI atau lebih tinggi untuk dokumen yang dipindai.
  • Teks tercetak bekerja jauh lebih baik daripada tulisan tangan.
  • Untuk PDF multi-halaman, konversi terlebih dahulu ke gambar dengan PDF to JPG / PNG dan OCR setiap halaman, atau gunakan alat PDF to Text khusus.

Contoh

Input — tangkapan layar label pengiriman, bahasa Inggris, JPG. Area teks output:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

Kesalahan umum dan jebakan

Sebagian besar kekecewaan OCR berasal dari gambar sumber, bukan mesin. Foto yang buruk tidak bisa diperbaiki dengan pengaturan yang lebih mewah.

  • Output kacau pada gambar resolusi rendah. Tangkapan layar ponsel dan thumbnail kecil menghasilkan teks yang rusak. Ambil ulang foto lebih dekat, atau gunakan file resolusi penuh asli jika Anda memilikinya.
  • Gambar diputar 90° atau terbalik. Tesseract tidak memutar secara otomatis. Perbaiki orientasi terlebih dahulu dengan Image Cropper, lalu coba lagi.
  • Kolom berselang-seling di output. OCR membaca dalam urutan pindaian alami dan dapat membingungkan tata letak multi-kolom. Potong gambar berdasarkan kolom terlebih dahulu, lalu OCR setiap kolom secara terpisah.
  • Tulisan tangan keluar salah. Tesseract dilatih pada teks tercetak dan berjuang dengan tulisan kursif atau berantakan. Untuk tulisan tangan blok yang terbaca, hasilnya bisa digunakan tetapi tidak pernah sempurna — harapkan pembersihan manual.
  • Teks non-Inggris adalah omong kosong. Membiarkan pemilih bahasa pada bahasa Inggris saat OCR bahasa Korea, Arab, atau Cina menghasilkan output yang terlihat acak. Pilih bahasa yang sesuai dari dropdown sebelum mengekstrak.
  • Tab membeku pada gambar besar. Foto di atas 20 megapiksel dapat menghabiskan memori selama pengenalan. Potong ke wilayah yang Anda inginkan dengan Image Cropper, atau kompres dengan Image Compress terlebih dahulu.
Pertanyaan yang sering diajukan

Format gambar apa yang didukung?

JPG, PNG, WebP, dan BMP. Format apa pun yang dapat didekode peramban Anda dengan Image API standar harus bekerja. Untuk foto HEIC dari iPhone, konversi ke JPG terlebih dahulu dengan alat HEIC to JPG.

Mengapa proses pertama lambat?

Tesseract membutuhkan sekitar 4 MB kode mesin yang dikompilasi dan 4 MB data model bahasa pada penggunaan pertama. Keduanya di-cache oleh peramban Anda, sehingga proses berikutnya dimulai dalam waktu kurang dari satu detik. Pengenalan itu sendiri biasanya membutuhkan 2–10 detik untuk tangkapan layar tipikal dan skala kira-kira dengan ukuran gambar.

Seberapa akurat?

Pada teks tercetak bersih pada 300 DPI atau lebih tinggi, akurasi biasanya 95%+. Pada tangkapan layar ponsel dari situs web, akurasi biasanya baik tetapi dapat melewatkan chrome UI kecil. Pada foto resolusi rendah, pindaian dengan noise, atau tulisan tangan, akurasi turun signifikan. Kami menggunakan data bahasa Tesseract cepat — keseimbangan baik antara kecepatan dan akurasi.

Bisakah menangani teks non-Inggris?

Ya — pilih bahasa yang sesuai dari pemilih. Proses OCR pertama dalam bahasa itu mengunduh model (3–14 MB) dan men-cache-nya setelahnya. Bahasa yang didukung termasuk Korea, Cina (Sederhana dan Tradisional), Jepang, Arab, Hindi, Spanyol, Prancis, Jerman, Portugis, Italia, Rusia, dan lainnya. Gambar bahasa campuran bekerja paling baik saat Anda memilih bahasa dominan.

Bagaimana dengan tulisan tangan?

Pengenalan tulisan tangan lemah. Tesseract dilatih pada teks tercetak dan berjuang dengan tulisan kursif atau berantakan. Tulisan tangan blok yang terbaca menghasilkan hasil yang dapat digunakan tetapi tidak sempurna; kursif biasanya tidak bekerja sama sekali.

Apakah Anda menyimpan gambar saya atau teks yang diekstrak?

Tidak. Kami tidak menyimpan gambar yang Anda letakkan atau teks yang dihasilkan OCR. Semuanya dibuang saat Anda menutup atau menyegarkan tab — tidak ada log, tidak ada catatan di pihak kami tentang apa yang Anda OCR. Anda dapat memverifikasi dengan alat pengembang peramban Anda.