Question 1

Quels formats d’image sont pris en charge ?

Accepted Answer

JPG, PNG, WebP et BMP. Tout format que votre navigateur peut décoder avec l’API Image standard devrait fonctionner. Pour les photos HEIC d’iPhone, convertissez d’abord en JPG avec l’outil HEIC vers JPG.

Question 2

Pourquoi la première exécution est-elle lente ?

Accepted Answer

Tesseract a besoin d’environ 4 Mo de code moteur compilé et 4 Mo de données de modèle de langue au premier usage. Les deux sont mis en cache par votre navigateur, donc les exécutions suivantes démarrent en moins d’une seconde. La reconnaissance elle-même prend en général 2 à 10 secondes sur une capture typique et varie avec la taille d’image.

Question 3

Quelle précision ?

Accepted Answer

Sur du texte imprimé propre à 300 DPI ou plus, la précision est généralement de 95 % ou plus. Sur des captures d’écran mobiles de sites web, la précision est en général bonne mais peut rater les petits éléments d’interface. Sur des photos basse résolution, des scans bruyants ou de l’écriture manuscrite, la précision chute sensiblement. Nous utilisons les données rapides de Tesseract — un bon compromis vitesse / précision.

Question 4

Gère-t-il les textes non-anglais ?

Accepted Answer

Oui — choisissez la langue correspondante dans le sélecteur. La première OCR dans cette langue télécharge le modèle (3–14 Mo), qui est ensuite mis en cache. Les langues prises en charge incluent le coréen, le chinois (simplifié et traditionnel), le japonais, l’arabe, l’hindi, l’espagnol, le français, l’allemand, le portugais, l’italien, le russe et d’autres. Les images multilingues fonctionnent mieux quand vous choisissez la langue dominante.

Question 5

Et l’écriture manuscrite ?

Accepted Answer

La reconnaissance manuscrite est faible. Tesseract est entraîné sur du texte imprimé et peine avec la cursive ou l’écriture brouillonne. Les lettres en script lisible donnent des résultats utilisables mais imparfaits ; la cursive ne fonctionne généralement pas.

Question 6

Conservez-vous mes images ou le texte extrait ?

Accepted Answer

Non. Nous ne conservons ni les images que vous déposez, ni le texte produit par l’OCR. Tout est supprimé quand vous fermez ou rechargez l’onglet — pas de journaux, aucune trace de ce que vous avez OCRé de notre côté. Vous pouvez le vérifier dans les outils de développement du navigateur.

Image vers texte — OCR dans votre navigateur

Conseils pour de meilleurs résultats

Exemple

Erreurs courantes et pièges