Question 1

どの画像フォーマットがサポートされていますか?

Accepted Answer

JPG、PNG、WebP、およびBMPです。ブラウザが標準Image APIでデコードできる任意のフォーマットは動作するはずです。iPhoneのHEIC写真の場合は、まずHEIC to JPGツールでJPGに変換してください。

Question 2

なぜ初回実行が遅いのですか?

Accepted Answer

Tesseractは初回使用時に約4 MBのコンパイル済みエンジンコードと4 MBの言語モデルデータを必要とします。両方ともブラウザによってキャッシュされるため、後続の実行は1秒未満で開始されます。認識自体は通常のスクリーンショットで通常2–10秒かかり、画像サイズにほぼ比例します。

Question 3

どれくらい正確ですか?

Accepted Answer

300 DPI以上のクリーンな印刷テキストでは、精度は通常95%+です。ウェブサイトの電話スクリーンショットでは、精度は通常良好ですが、小さなUIクロームを見逃す可能性があります。低解像度の写真、ノイズのあるスキャン、または手書きでは、精度が大幅に低下します。高速なTesseract言語データを使用しています — 速度と精度のバランスが良いです。

Question 4

非英語のテキストを処理できますか?

Accepted Answer

はい — セレクタから一致する言語を選択してください。その言語での最初のOCR実行はモデル (3–14 MB) をダウンロードし、その後キャッシュします。サポートされている言語には、韓国語、中国語 (簡体字および繁体字)、日本語、アラビア語、ヒンディー語、スペイン語、フランス語、ドイツ語、ポルトガル語、イタリア語、ロシア語などがあります。混合言語の画像は、主要な言語を選択したときに最適に機能します。

Question 5

手書きはどうですか?

Accepted Answer

手書き認識は弱いです。Tesseractは印刷されたテキストで訓練されており、筆記体や乱雑な書き物に苦戦します。読みやすいブロック文字の手書きは使用可能ですが不完全な結果を生成します。筆記体は通常まったく機能しません。

Question 6

画像や抽出されたテキストを保存しますか?

Accepted Answer

いいえ。ドロップした画像やOCRが生成するテキストを保存しません。タブを閉じるか更新するとすべて破棄されます — ログなし、あなたがOCRしたものの記録は私たちの側にありません。ブラウザの開発者ツールで確認できます。

画像からテキストへ — ブラウザでOCR

最良の結果のためのヒント

例

よくあるエラーと落とし穴