Viendo en Español Ver en inglés

Imagen a texto — OCR en tu navegador

Extrae texto de fotos, capturas de pantalla y documentos escaneados. Tesseract OCR funciona completamente en tu navegador — nada se sube.

Arrastra las imágenes aquí o
  1. Arrastra o elige una o varias imágenes — JPG, PNG, WebP o BMP.
  2. Elige un idioma si tu texto no está en inglés — la primera ejecución en ese idioma descarga el modelo (3–14 MB) y lo guarda en la caché del navegador.
  3. Pulsa Extraer todo. La primera ejecución descarga unos 8 MB del motor OCR y los datos de idioma (el navegador los guarda para la próxima vez y se reutilizan en cada imagen del lote).
  4. La vista previa de abajo muestra el texto de la primera imagen. Descarga el texto de cada imagen desde su fila, copia la salida de todos los archivos al portapapeles o descarga un .txt combinado.
¿Qué hace?

OCR (reconocimiento óptico de caracteres) convierte los píxeles que parecen texto en texto real. Esta herramienta usa Tesseract —el motor OCR de código abierto mantenido por Google— compilado a WebAssembly. Funciona mejor en texto impreso; el reconocimiento de escritura a mano es más débil.

Consejos para mejores resultados

  • Alto contraste entre el texto y el fondo.
  • Imágenes sin inclinación — si está ladeada o torcida, gírala primero con el Recortador de imagen.
  • 300 DPI o más para documentos escaneados.
  • El texto impreso funciona mucho mejor que el manuscrito.
  • Para un PDF multipágina, conviértelo primero a imágenes con PDF a JPG / PNG y haz OCR a cada página, o usa la herramienta dedicada PDF a texto.

Ejemplo

Entrada — una captura en inglés de una etiqueta de envío, JPG. Área de texto de salida:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

Errores comunes y advertencias

La mayoría de decepciones con OCR vienen de la imagen de origen, no del motor. Una foto mala no se recupera con un ajuste más sofisticado.

  • Salida ilegible en una imagen de baja resolución. Las capturas de pantalla de móvil y las miniaturas pequeñas producen texto estropeado. Haz la foto más cerca, o usa el archivo original a plena resolución si lo tienes.
  • La imagen está girada 90° o boca abajo. Tesseract no gira automáticamente. Corrige la orientación con el Recortador de imagen y vuelve a intentarlo.
  • Las columnas aparecen entrelazadas en la salida. OCR lee en el orden natural del escaneo y puede confundir diseños a varias columnas. Recorta la imagen por columnas y haz OCR a cada columna por separado.
  • La escritura a mano sale mal. Tesseract está entrenado con texto impreso y le cuesta con cursiva o letra desordenada. Con mayúsculas legibles, los resultados son usables pero nunca perfectos — cuenta con retocar a mano.
  • El texto no-inglés sale como galimatías. Dejar el selector de idioma en inglés mientras haces OCR a coreano, árabe o chino produce texto aparentemente aleatorio. Elige el idioma correspondiente del desplegable antes de extraer.
  • La pestaña se queda colgada con una imagen enorme. Las fotos de más de 20 megapíxeles pueden agotar la memoria durante el reconocimiento. Recorta la región que te interesa con el Recortador o reduce el tamaño con Compresión de imagen antes.
Preguntas frecuentes

¿Qué formatos de imagen se admiten?

JPG, PNG, WebP y BMP. Cualquier formato que tu navegador pueda decodificar con la API de Imagen estándar debería funcionar. Para fotos HEIC de iPhone, conviértelas primero a JPG con la herramienta HEIC a JPG.

¿Por qué la primera ejecución es lenta?

Tesseract necesita unos 4 MB de código de motor compilado y 4 MB de datos de modelo de idioma en el primer uso. El navegador los guarda en caché, así que las ejecuciones siguientes arrancan en menos de un segundo. El reconocimiento en sí suele tardar 2–10 segundos para una captura típica y escala con el tamaño de la imagen.

¿Qué tan preciso es?

En texto impreso limpio a 300 DPI o más, la precisión suele ser del 95% o más. En capturas de móvil de sitios web, suele ser buena pero puede perder chrome de UI pequeño. En fotos de baja resolución, escaneos con ruido o escritura a mano, la precisión baja bastante. Usamos los datos rápidos de Tesseract — un buen equilibrio entre velocidad y precisión.

¿Puede con texto no-inglés?

Sí — elige el idioma correspondiente en el selector. La primera OCR en ese idioma descarga el modelo (3–14 MB) y lo cachea después. Los idiomas admitidos incluyen coreano, chino (simplificado y tradicional), japonés, árabe, hindi, español, francés, alemán, portugués, italiano, ruso y más. Las imágenes multilingües funcionan mejor si eliges el idioma dominante.

¿Y la escritura a mano?

El reconocimiento de manuscritos es débil. Tesseract está entrenado con texto impreso y le cuesta con cursiva o letra desordenada. Las mayúsculas legibles dan resultados usables pero imperfectos; la cursiva normalmente no funciona.

¿Guardáis mis imágenes o el texto extraído?

No. No guardamos las imágenes que sueltas ni el texto que produce el OCR. Todo se descarta al cerrar o recargar la pestaña — sin registros, sin constancia por nuestra parte de lo que has pasado por OCR. Puedes comprobarlo con las herramientas de desarrollador del navegador.