Question 1

Quais formatos de imagem são suportados?

Accepted Answer

JPG, PNG, WebP e BMP. Qualquer formato que seu navegador consiga decodificar com a API de Imagem padrão deve funcionar. Para fotos HEIC do iPhone, converta primeiro para JPG com a ferramenta HEIC para JPG.

Question 2

Por que a primeira execução é lenta?

Accepted Answer

O Tesseract precisa de cerca de 4 MB de código de motor compilado e 4 MB de dados de modelo de idioma no primeiro uso. Ambos ficam em cache no navegador, portanto execuções seguintes começam em menos de um segundo. O reconhecimento em si costuma levar 2–10 segundos em uma captura típica e escala aproximadamente com o tamanho da imagem.

Question 3

Quão preciso é?

Accepted Answer

Em texto impresso limpo a 300 DPI ou mais, a precisão costuma ser de 95% ou mais. Em capturas de tela de celular de sites, a precisão geralmente é boa mas pode perder elementos pequenos de interface. Em fotos de baixa resolução, digitalizações ruidosas ou manuscritos, a precisão cai bastante. Usamos os dados rápidos do Tesseract — um bom equilíbrio entre velocidade e precisão.

Question 4

Funciona com texto não-inglês?

Accepted Answer

Sim — escolha o idioma correspondente no seletor. A primeira OCR nesse idioma baixa o modelo (3–14 MB) e o guarda em cache. Os idiomas suportados incluem coreano, chinês (simplificado e tradicional), japonês, árabe, hindi, espanhol, francês, alemão, português, italiano, russo e outros. Imagens multilíngues funcionam melhor quando você escolhe o idioma dominante.

Question 5

E quanto ao manuscrito?

Accepted Answer

O reconhecimento de manuscrito é fraco. O Tesseract é treinado em texto impresso e tem dificuldade com cursiva ou escrita desordenada. Letra de forma legível dá resultados utilizáveis mas imperfeitos; cursiva normalmente não funciona.

Question 6

Vocês salvam minhas imagens ou o texto extraído?

Accepted Answer

Não. Não salvamos as imagens que você solta nem o texto produzido pelo OCR. Tudo é descartado quando você fecha ou recarrega a aba — sem logs, sem registro do nosso lado do que você passou pelo OCR. Você pode verificar nas ferramentas de desenvolvedor do seu navegador.

Imagem para texto — OCR no seu navegador

Dicas para melhores resultados

Exemplo

Erros comuns e armadilhas