Изображение в текст — OCR в вашем браузере
Извлекайте текст из фотографий, скриншотов и отсканированных документов. Tesseract OCR работает полностью в вашем браузере — ничего не загружается.
- Перетащите или выберите одно или много изображений — JPG, PNG, WebP или BMP.
- Выберите язык, если ваш текст не на английском — первый запуск на этом языке загружает модель (3–14 MB) и кэширует её в вашем браузере на следующий раз.
- Нажмите Извлечь все. Первый запуск загружает примерно 8 MB OCR-движка и языковых данных с этого сайта (кэшируется вашим браузером и используется повторно для каждого изображения в пакете).
- Распознанный текст первого изображения появляется в предпросмотре ниже. Скачайте текст каждого изображения отдельно из его строки, скопируйте всё в буфер обмена или возьмите один объединённый .txt с выводом каждого файла, разделённым заголовками.
Что это делает?
OCR (Optical Character Recognition) превращает пиксели, похожие на текст, в фактический текст. Этот инструмент работает на Tesseract — OCR-движке с открытым исходным кодом, поддерживаемом Google — скомпилированном в WebAssembly. Лучше всего работает на печатном тексте; распознавание рукописного текста слабее.
Советы для лучших результатов
- Высокий контраст между текстом и фоном.
- Не перекошенные сканы — поверните изображение сначала с помощью Image Cropper, если оно на боку или наклонено.
- 300 DPI или выше для отсканированных документов.
- Печатный текст работает намного лучше, чем рукописный.
- Для многостраничного PDF сначала конвертируйте в изображения с помощью PDF to JPG / PNG и выполните OCR для каждой страницы, или используйте специальный инструмент PDF to Text.
Пример
Ввод — скриншот транспортной этикетки, английский, JPG. Область вывода текста:
SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA
TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12 Частые ошибки и подводные камни
Большинство разочарований OCR исходят от исходного изображения, а не от движка. Плохое фото не может быть восстановлено более причудливой настройкой.
- Искажённый вывод на изображении с низким разрешением. Скриншоты телефона и крошечные миниатюры создают искажённый текст. Переснимите фото ближе или используйте оригинальный файл полного разрешения, если он у вас есть.
- Изображение повёрнуто на 90° или перевёрнуто. Tesseract не поворачивает автоматически. Сначала исправьте ориентацию с помощью Image Cropper, затем повторите попытку.
- Колонки переплетаются в выводе. OCR читает в естественном порядке сканирования и может путаться с многоколоночными макетами. Сначала обрежьте изображение по колонкам, затем выполните OCR для каждой колонки отдельно.
- Рукописный текст выходит неправильно. Tesseract обучен на печатном тексте и плохо справляется с курсивом или неаккуратным почерком. Для разборчивого печатного рукописного текста результаты пригодны, но никогда не идеальны — ожидайте ручной очистки.
- Неанглийский текст — тарабарщина. Оставление селектора языка на английском при OCR корейского, арабского или китайского даёт случайно выглядящий вывод. Перед извлечением выберите соответствующий язык из выпадающего списка.
- Вкладка зависает на огромном изображении. Фотографии выше 20 мегапикселей могут исчерпать память во время распознавания. Обрежьте до нужной области с помощью Image Cropper или сначала сожмите с помощью Image Compress.
Часто задаваемые вопросы
Какие форматы изображений поддерживаются?
JPG, PNG, WebP и BMP. Любой формат, который ваш браузер может декодировать с помощью стандартного Image API, должен работать. Для фотографий HEIC с iPhone сначала конвертируйте в JPG с помощью инструмента HEIC to JPG.
Почему первый запуск медленный?
Tesseract требует около 4 MB скомпилированного кода движка и 4 MB данных языковой модели при первом использовании. Оба кэшируются вашим браузером, поэтому последующие запуски стартуют менее чем за секунду. Само распознавание обычно занимает 2–10 секунд для типичного скриншота и примерно масштабируется с размером изображения.
Насколько это точно?
На чистом печатном тексте при 300 DPI или выше точность обычно 95%+. На скриншотах веб-сайтов с телефона точность обычно хорошая, но может пропускать мелкие элементы UI. На фотографиях низкого разрешения, сканах с шумом или рукописном тексте точность значительно падает. Мы используем быстрые языковые данные Tesseract — хороший баланс скорости и точности.
Может ли это обрабатывать неанглийский текст?
Да — выберите соответствующий язык из селектора. Первый запуск OCR на этом языке загружает модель (3–14 MB) и кэширует её после. Поддерживаемые языки включают корейский, китайский (упрощённый и традиционный), японский, арабский, хинди, испанский, французский, немецкий, португальский, итальянский, русский и другие. Изображения со смешанными языками лучше всего работают, когда вы выбираете доминирующий язык.
А что насчёт рукописного текста?
Распознавание рукописного текста слабое. Tesseract обучен на печатном тексте и плохо справляется с курсивом или неаккуратным письмом. Разборчивый печатный рукописный текст даёт пригодные, но несовершенные результаты; курсив обычно не работает совсем.
Сохраняете ли вы мои изображения или извлечённый текст?
Нет. Мы не сохраняем изображения, которые вы перетаскиваете, или текст, который производит OCR. Всё отбрасывается, когда вы закрываете или обновляете вкладку — никаких логов, никаких записей с нашей стороны о том, что вы OCR-ли. Вы можете проверить с помощью инструментов разработчика своего браузера.