Question 1

کیا یہ اسکین شدہ PDFs اور صرف امیج PDFs پر کام کرتا ہے؟

Accepted Answer

جی ہاں — یہی اصل مقصد ہے۔ ہر صفحہ ایک تصویر پر رینڈر ہوتا ہے اور OCR سے گزارا جاتا ہے، سو یہ یکساں کام کرتا ہے چاہے PDF ڈیجیٹل پیدا ہوئی ہو یا اسکین کی گئی۔ ڈیجیٹل پیدا شدہ PDFs کے لیے جن میں پہلے سے قابل انتخاب متن ہو، براہ راست متن نکالنے والا ٹول تیز اور زیادہ درست ہے؛ OCR تب صحیح انتخاب ہے جب متن صفحہ تصاویر میں پکا ہو۔

Question 2

مجھے کون سا DPI چننا چاہیے؟

Accepted Answer

عام اسکینز اور اسکرین شاٹس پر OCR درستگی کے لیے 200 DPI اچھا ڈیفالٹ ہے۔ 150 DPI تیز ہے مگر چھوٹا متن کھو دیتا ہے۔ 300 DPI گھنے صفحات، چھوٹے فونٹس یا کم معیار کے اسکینز میں مدد کرتا ہے لیکن رینڈرنگ وقت اور میموری استعمال دگنا کرتا ہے۔ 300 سے اوپر جانا شاذ و نادر ہی مدد دیتا ہے اگر خود سورس اسکین کم ریزولوشن کا ہو۔

Question 3

پہلی بار چلانا سست کیوں ہے؟

Accepted Answer

پہلی بار چلانے پر اس سائٹ سے تقریباً 8 MB OCR انجن اور انگریزی زبان ڈیٹا ڈاؤن لوڈ ہوتا ہے، پھر آپ کے براؤزر میں کیش ہوتا ہے۔ اس کے بعد کے رنز ایک سیکنڈ سے کم میں شروع ہوتے ہیں۔ پھر رفتار ہر صفحے کو رینڈر کرنے اور پہچاننے پر منحصر ہوتی ہے — عام طور پر DPI اور صفحہ کی پیچیدگی کے مطابق فی صفحہ 3–10 سیکنڈ۔

Question 4

ہاتھ سے لکھے اور غیر انگریزی متن کا کیا ہوگا؟

Accepted Answer

ہاتھ سے لکھے کی پہچان کمزور ہے — Tesseract چھپے ہوئے متن پر تربیت یافتہ ہے اور cursive یا بے ترتیب لکھائی میں مشکل پیش آتی ہے۔ غیر انگریزی متن کے لیے سلیکٹر سے ملتی جلتی زبان چنیں؛ اس زبان میں پہلی OCR رن ماڈل ڈاؤن لوڈ کرتی ہے (3–14 MB) اور بعد میں کیش کر لیتی ہے۔ مخلوط زبان کے صفحات بہترین کام کرتے ہیں جب آپ غالب زبان چنتے ہیں۔

Question 5

کیا یہ پاس ورڈ سے محفوظ PDFs ہینڈل کر سکتا ہے؟

Accepted Answer

نہیں۔ انکرپٹڈ PDFs ایک خرابی کے ساتھ لوڈ نہیں ہوتیں۔ اپنے PDF ویوئر میں فائل کھولیں، پاس ورڈ درج کریں، اور File > Save As کے ذریعے غیر محفوظ کاپی بنانے کے لیے دوبارہ محفوظ کریں۔ پھر وہ کاپی یہاں ڈراپ کریں۔

Question 6

کیا آپ میری PDFs یا نکالا گیا متن محفوظ کرتے ہیں؟

Accepted Answer

نہیں۔ آپ کی ڈراپ کی گئی PDF، رینڈرڈ صفحہ تصاویر، یا نکالا گیا متن ہم محفوظ نہیں کرتے۔ جب آپ ٹیب بند یا ریفریش کرتے ہیں تو سب ختم ہو جاتا ہے — کوئی لاگ نہیں، آپ نے کیا OCR کیا اس کا کوئی ریکارڈ نہیں۔ آپ براؤزر کے DevTools سے تصدیق کر سکتے ہیں۔

PDF سے متن — آپ کے براؤزر میں OCR

مثال

عام غلطیاں اور نقصانات