Question 1

कौन-से इमेज प्रारूप समर्थित हैं?

Accepted Answer

JPG, PNG, WebP और BMP। वह हर प्रारूप जिसे आपका ब्राउज़र मानक Image API से डीकोड कर सकता है। iPhone की HEIC फ़ोटो के लिए पहले "HEIC से JPG" टूल से बदलें।

Question 2

पहली बार चलाना धीमा क्यों है?

Accepted Answer

Tesseract को पहली बार लगभग 4 MB संकलित इंजन कोड और 4 MB भाषा मॉडल डेटा चाहिए। दोनों ब्राउज़र में कैश हो जाते हैं, इसलिए आगे की बार एक सेकंड से कम में शुरू हो जाता है। पहचान ख़ुद आम स्क्रीनशॉट पर 2–10 सेकंड लगाती है और इमेज आकार के अनुसार बढ़ती है।

Question 3

कितना सटीक है?

Accepted Answer

साफ़ मुद्रित टेक्स्ट 300 DPI या अधिक पर, सटीकता आमतौर पर 95%+। वेबसाइट के फ़ोन स्क्रीनशॉट पर सटीकता आम तौर पर अच्छी है पर छोटे UI टेक्स्ट छूट सकते हैं। कम रिज़ॉल्यूशन फ़ोटो, शोर वाले स्कैन या हस्तलेख पर सटीकता काफ़ी गिर जाती है। हम fast Tesseract भाषा डेटा उपयोग करते हैं — गति और सटीकता का अच्छा संतुलन।

Question 4

क्या गैर-अंग्रेज़ी टेक्स्ट भी चलता है?

Accepted Answer

हाँ — चयनकर्ता से मिलती-जुलती भाषा चुनें। उस भाषा में पहला OCR चलाने पर मॉडल (3–14 MB) डाउनलोड होगा और बाद में कैश होगा। समर्थित भाषाओं में कोरियाई, चीनी (सरल और पारंपरिक), जापानी, अरबी, हिंदी, स्पेनिश, फ्रेंच, जर्मन, पुर्तगाली, इतालवी, रूसी आदि शामिल हैं। मिश्रित-भाषा इमेज में प्रमुख भाषा चुनना सबसे अच्छा काम करता है।

Question 5

हस्तलिखित के बारे में क्या?

Accepted Answer

हस्तलिखित पहचान कमज़ोर है। Tesseract मुद्रित टेक्स्ट पर प्रशिक्षित है और घसीट या मैली लिखावट पर संघर्ष करता है। सुपाठ्य ब्लॉक-लेटर परिणाम इस्तेमाल करने योग्य पर अपूर्ण होते हैं; घसीट आम तौर पर बिल्कुल नहीं चलती।

Question 6

क्या आप मेरी इमेज या निकाला गया टेक्स्ट सहेजते हैं?

Accepted Answer

नहीं। हम आपकी छोड़ी गई इमेज या OCR से निकाला गया टेक्स्ट नहीं सहेजते। टैब बंद या रिफ्रेश करते ही सब कुछ हट जाता है — कोई लॉग नहीं, हमारी तरफ़ कोई रिकॉर्ड नहीं कि आपने क्या OCR किया। अपने ब्राउज़र के डेवलपर टूल्स से जाँच कर सकते हैं।

इमेज से टेक्स्ट — आपके ब्राउज़र में OCR

बेहतर परिणामों के लिए सुझाव

उदाहरण

सामान्य त्रुटियाँ और सावधानियाँ