देख रहे हैं: हिन्दी अंग्रेज़ी में देखें

इमेज से टेक्स्ट — आपके ब्राउज़र में OCR

फ़ोटो, स्क्रीनशॉट और स्कैन किए गए दस्तावेज़ों से टेक्स्ट निकालें। Tesseract OCR पूरी तरह आपके ब्राउज़र में चलता है — कुछ भी अपलोड नहीं।

इमेज यहाँ छोड़ें या
  1. एक या कई इमेज छोड़ें या ब्राउज़ करें — JPG, PNG, WebP, BMP सभी समर्थित हैं।
  2. अगर टेक्स्ट अंग्रेज़ी में नहीं है तो संगत भाषा चुनें — उस भाषा में पहली बार चलाने पर मॉडल (3–14 MB) डाउनलोड होगा और बाद में ब्राउज़र उसे कैश कर लेगा।
  3. "सब निकालें" पर क्लिक करें। पहली बार इस साइट से OCR इंजन और भाषा डेटा (लगभग 8 MB) डाउनलोड होगा (ब्राउज़र इसे कैश करेगा और बैच की हर इमेज में दोबारा इस्तेमाल करेगा)।
  4. पहली इमेज का पहचाना गया टेक्स्ट नीचे पूर्वावलोकन में दिखेगा। हर पंक्ति से उस इमेज का टेक्स्ट डाउनलोड करें, सब कुछ क्लिपबोर्ड पर कॉपी करें, या एक संयुक्त .txt लें।
यह क्या करता है?

OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) उन पिक्सल को असली टेक्स्ट में बदलता है जो अक्षरों जैसे दिखते हैं। यह टूल Tesseract चलाता है — Google द्वारा रखरखाव किया जाने वाला ओपन-सोर्स OCR इंजन — जिसे WebAssembly में संकलित किया गया है। मुद्रित टेक्स्ट पर सबसे अच्छा; हस्तलिखित पहचान कमज़ोर है।

बेहतर परिणामों के लिए सुझाव

  • टेक्स्ट और पृष्ठभूमि के बीच ऊँचा कॉन्ट्रास्ट।
  • सीधी इमेज — अगर बगल में या टेढ़ी है तो पहले "इमेज क्रॉपर" से घुमाएँ।
  • स्कैन दस्तावेज़ों के लिए 300 DPI या अधिक।
  • मुद्रित टेक्स्ट हस्तलिखित से कहीं बेहतर काम करता है।
  • बहु-पृष्ठ PDF के लिए पहले "PDF से JPG / PNG" से इमेज बनाएँ और हर पन्ने पर OCR करें, या सीधे "PDF से टेक्स्ट" टूल इस्तेमाल करें।

उदाहरण

इनपुट — शिपिंग लेबल का अंग्रेज़ी JPG स्क्रीनशॉट। आउटपुट टेक्स्टएरिया:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

सामान्य त्रुटियाँ और सावधानियाँ

OCR की अधिकांश निराशाएँ स्रोत इमेज से आती हैं, इंजन से नहीं। खराब फ़ोटो को किसी नए सेटिंग से ठीक नहीं किया जा सकता।

  • कम रिज़ॉल्यूशन की इमेज पर अस्पष्ट आउटपुट। फ़ोन स्क्रीनशॉट और छोटे थंबनेल में टेक्स्ट गड़बड़ आता है। फ़ोटो पास से दोबारा लें, या यदि उपलब्ध हो तो मूल पूर्ण-रिज़ॉल्यूशन फ़ाइल इस्तेमाल करें।
  • इमेज 90° या उल्टी घुमी हुई है। Tesseract अपने आप नहीं घुमाता। पहले "इमेज क्रॉपर" से दिशा ठीक करें, फिर दोबारा कोशिश करें।
  • आउटपुट में कॉलम आपस में मिल जाते हैं। OCR स्वाभाविक स्कैन क्रम में पढ़ता है और मल्टी-कॉलम लेआउट को उलझा सकता है। पहले इमेज को कॉलम के हिसाब से क्रॉप करें, फिर हर कॉलम पर अलग-अलग OCR चलाएँ।
  • हस्तलिखित गलत आता है। Tesseract मुद्रित टेक्स्ट पर प्रशिक्षित है और घसीट या मैली लिखावट पर संघर्ष करता है। सुपाठ्य ब्लॉक-लेटर लिखावट के लिए परिणाम इस्तेमाल करने योग्य हैं पर कभी बढ़िया नहीं — हाथ से साफ़ करने की उम्मीद रखें।
  • गैर-अंग्रेज़ी टेक्स्ट बेमतलब आता है। कोरियाई, अरबी या चीनी पर OCR करते समय भाषा चयन अंग्रेज़ी पर छोड़ देने से नतीजे यादृच्छिक-से दिखते हैं। निकालने से पहले ड्रॉपडाउन में सही भाषा चुनें।
  • बहुत बड़ी इमेज पर टैब जम जाता है। 2 करोड़ पिक्सल से अधिक फ़ोटो पहचान के दौरान मेमोरी खत्म कर सकते हैं। "इमेज क्रॉपर" से केवल ज़रूरी हिस्सा काटें, या पहले "इमेज कंप्रेस" से आकार घटाएँ।
अक्सर पूछे जाने वाले प्रश्न

कौन-से इमेज प्रारूप समर्थित हैं?

JPG, PNG, WebP और BMP। वह हर प्रारूप जिसे आपका ब्राउज़र मानक Image API से डीकोड कर सकता है। iPhone की HEIC फ़ोटो के लिए पहले "HEIC से JPG" टूल से बदलें।

पहली बार चलाना धीमा क्यों है?

Tesseract को पहली बार लगभग 4 MB संकलित इंजन कोड और 4 MB भाषा मॉडल डेटा चाहिए। दोनों ब्राउज़र में कैश हो जाते हैं, इसलिए आगे की बार एक सेकंड से कम में शुरू हो जाता है। पहचान ख़ुद आम स्क्रीनशॉट पर 2–10 सेकंड लगाती है और इमेज आकार के अनुसार बढ़ती है।

कितना सटीक है?

साफ़ मुद्रित टेक्स्ट 300 DPI या अधिक पर, सटीकता आमतौर पर 95%+। वेबसाइट के फ़ोन स्क्रीनशॉट पर सटीकता आम तौर पर अच्छी है पर छोटे UI टेक्स्ट छूट सकते हैं। कम रिज़ॉल्यूशन फ़ोटो, शोर वाले स्कैन या हस्तलेख पर सटीकता काफ़ी गिर जाती है। हम fast Tesseract भाषा डेटा उपयोग करते हैं — गति और सटीकता का अच्छा संतुलन।

क्या गैर-अंग्रेज़ी टेक्स्ट भी चलता है?

हाँ — चयनकर्ता से मिलती-जुलती भाषा चुनें। उस भाषा में पहला OCR चलाने पर मॉडल (3–14 MB) डाउनलोड होगा और बाद में कैश होगा। समर्थित भाषाओं में कोरियाई, चीनी (सरल और पारंपरिक), जापानी, अरबी, हिंदी, स्पेनिश, फ्रेंच, जर्मन, पुर्तगाली, इतालवी, रूसी आदि शामिल हैं। मिश्रित-भाषा इमेज में प्रमुख भाषा चुनना सबसे अच्छा काम करता है।

हस्तलिखित के बारे में क्या?

हस्तलिखित पहचान कमज़ोर है। Tesseract मुद्रित टेक्स्ट पर प्रशिक्षित है और घसीट या मैली लिखावट पर संघर्ष करता है। सुपाठ्य ब्लॉक-लेटर परिणाम इस्तेमाल करने योग्य पर अपूर्ण होते हैं; घसीट आम तौर पर बिल्कुल नहीं चलती।

क्या आप मेरी इमेज या निकाला गया टेक्स्ट सहेजते हैं?

नहीं। हम आपकी छोड़ी गई इमेज या OCR से निकाला गया टेक्स्ट नहीं सहेजते। टैब बंद या रिफ्रेश करते ही सब कुछ हट जाता है — कोई लॉग नहीं, हमारी तरफ़ कोई रिकॉर्ड नहीं कि आपने क्या OCR किया। अपने ब्राउज़र के डेवलपर टूल्स से जाँच कर सकते हैं।