دیکھ رہے ہیں: اردو انگریزی پر جائیں

تصویر سے متن — آپ کے براؤزر میں OCR

تصاویر، اسکرین شاٹس، اور اسکین کردہ دستاویزات سے متن نکالیں۔ Tesseract OCR مکمل طور پر آپ کے براؤزر میں چلتا ہے — کچھ بھی اپ لوڈ نہیں ہوتا۔

تصاویر یہاں چھوڑیں یا
  1. ایک یا کئی تصاویر کے لیے چھوڑیں یا براؤز کریں — JPG، PNG، WebP، یا BMP۔
  2. اگر آپ کا متن انگریزی نہیں ہے تو زبان منتخب کریں — اس زبان میں پہلی بار چلنے پر ماڈل (3–14 MB) ڈاؤن لوڈ ہوتا ہے اور اگلی بار کے لیے آپ کے براؤزر میں محفوظ ہوتا ہے۔
  3. سب نکالیں پر کلک کریں۔ پہلی بار چلنے پر اس سائٹ سے تقریباً 8 MB OCR انجن اور زبان کا ڈیٹا ڈاؤن لوڈ ہوتا ہے (آپ کے براؤزر میں محفوظ ہو کر بیچ میں ہر تصویر پر دوبارہ استعمال ہوتا ہے)۔
  4. پہلی تصویر کا شناخت شدہ متن نیچے پیش منظر میں ظاہر ہوتا ہے۔ اس کی قطار سے ہر تصویر کا متن انفرادی طور پر ڈاؤن لوڈ کریں، کلپ بورڈ پر سب کچھ کاپی کریں، یا ایک مشترکہ .txt لیں جس میں ہر فائل کا آؤٹ پٹ عنوانات سے الگ ہو۔
یہ کیا کرتا ہے؟

OCR (Optical Character Recognition) ان پکسلز کو جو متن کی طرح نظر آتے ہیں اصل متن میں بدلتا ہے۔ یہ ٹول Tesseract چلاتا ہے — Google کی طرف سے برقرار رکھا جانے والا اوپن سورس OCR انجن — WebAssembly پر کمپائل شدہ۔ پرنٹ شدہ متن پر بہترین کام کرتا ہے؛ ہاتھ سے لکھی تحریر کی شناخت کمزور ہے۔

بہترین نتائج کے لیے ٹپس

  • متن اور پس منظر کے درمیان زیادہ کنٹراسٹ۔
  • سیدھے اسکین — اگر تصویر ایک طرف یا ترچھی ہے تو Image Cropper کے ساتھ پہلے گھمائیں۔
  • اسکین کی گئی دستاویزات کے لیے 300 DPI یا زیادہ۔
  • پرنٹ شدہ متن ہاتھ سے لکھی تحریر سے بہت بہتر کام کرتا ہے۔
  • کثیر صفحاتی PDF کے لیے، پہلے PDF to JPG / PNG کے ساتھ تصاویر میں تبدیل کریں اور ہر صفحے کو OCR کریں، یا مخصوص PDF to Text ٹول استعمال کریں۔

مثال

ان پٹ — ایک شپنگ لیبل کا اسکرین شاٹ، انگریزی، JPG۔ آؤٹ پٹ ٹیکسٹ ایریا:

SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA

TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12

عام غلطیاں اور نقصانات

زیادہ تر OCR مایوسیاں ماخذ تصویر سے آتی ہیں، انجن سے نہیں۔ خراب تصویر کو زیادہ شاندار سیٹنگ کے ساتھ ٹھیک نہیں کیا جا سکتا۔

  • کم ریزولوشن تصویر پر بکھرا ہوا آؤٹ پٹ۔ فون اسکرین شاٹس اور چھوٹے تھمب نیلز خراب متن پیدا کرتے ہیں۔ تصویر کو قریب سے دوبارہ لیں، یا اگر آپ کے پاس اصل مکمل ریزولوشن والی فائل ہے تو اسے استعمال کریں۔
  • تصویر 90° یا الٹی گھومی ہوئی۔ Tesseract خود بخود نہیں گھماتا۔ پہلے Image Cropper سے سمت کو درست کریں، پھر دوبارہ کوشش کریں۔
  • آؤٹ پٹ میں کالم آپس میں ملے ہوئے۔ OCR قدرتی اسکین ترتیب میں پڑھتا ہے اور ملٹی کالم لے آؤٹ کو الجھا سکتا ہے۔ پہلے کالم کے لحاظ سے تصویر کاٹیں، پھر ہر کالم کو الگ سے OCR کریں۔
  • ہاتھ سے لکھی تحریر غلط آتی ہے۔ Tesseract پرنٹ شدہ متن پر تربیت یافتہ ہے اور ترچھی یا گندی ہاتھ کی تحریر سے لڑتا ہے۔ پڑھنے کے قابل بلاک حرف ہاتھ کی تحریر کے لیے، نتائج قابل استعمال ہیں لیکن کبھی بہترین نہیں — ہاتھ سے صاف کرنے کی توقع کریں۔
  • غیر انگریزی متن بکواس ہے۔ کوریائی، عربی، یا چینی OCR کرتے ہوئے زبان سلیکٹر کو انگریزی پر چھوڑنا تصادفی نظر آنے والا آؤٹ پٹ پیدا کرتا ہے۔ نکالنے سے پہلے ڈراپ ڈاؤن سے مماثل زبان منتخب کریں۔
  • بڑی تصویر پر ٹیب جم جاتا ہے۔ 20 میگاپکسل سے اوپر کی تصاویر شناخت کے دوران میموری ختم کر سکتی ہیں۔ Image Cropper سے اس علاقے تک کاٹیں جس کی آپ کو پروا ہے، یا پہلے Image Compress کے ساتھ کمپریس کریں۔
اکثر پوچھے جانے والے سوالات

کون سے تصویری فارمیٹس سپورٹ ہوتے ہیں؟

JPG، PNG، WebP، اور BMP۔ کوئی بھی فارمیٹ جسے آپ کا براؤزر معیاری Image API سے ڈیکوڈ کر سکے کام کرنا چاہیے۔ iPhones سے HEIC تصاویر کے لیے، پہلے HEIC to JPG ٹول سے JPG میں تبدیل کریں۔

پہلی بار چلانا کیوں سست ہے؟

Tesseract کو پہلے استعمال پر تقریباً 4 MB کمپائل شدہ انجن کوڈ اور 4 MB زبان ماڈل ڈیٹا کی ضرورت ہے۔ دونوں آپ کے براؤزر میں محفوظ ہوتے ہیں، لہذا بعد میں چلنا ایک سیکنڈ سے کم میں شروع ہوتا ہے۔ شناخت خود عام اسکرین شاٹ کے لیے عام طور پر 2–10 سیکنڈ لیتی ہے اور تصویر کے سائز کے ساتھ تقریباً بڑھتی ہے۔

یہ کتنا درست ہے؟

300 DPI یا اس سے زیادہ پر صاف پرنٹ شدہ متن پر، درستگی عام طور پر 95%+ ہوتی ہے۔ ویب سائٹس کے فون اسکرین شاٹس پر، درستگی عام طور پر اچھی ہوتی ہے لیکن چھوٹے UI کروم کو چھوڑ سکتی ہے۔ کم ریزولوشن کی تصاویر، شور والی اسکینز، یا ہاتھ کی تحریر پر، درستگی نمایاں طور پر گر جاتی ہے۔ ہم تیز Tesseract زبان کا ڈیٹا استعمال کرتے ہیں — رفتار اور درستگی کا اچھا توازن۔

کیا یہ غیر انگریزی متن کو سنبھال سکتا ہے؟

ہاں — سلیکٹر سے مماثل زبان منتخب کریں۔ اس زبان میں پہلا OCR چلنا ماڈل (3–14 MB) ڈاؤن لوڈ کرتا ہے اور بعد میں اسے محفوظ کرتا ہے۔ سپورٹ کی گئی زبانوں میں کوریائی، چینی (سادہ اور روایتی)، جاپانی، عربی، ہندی، ہسپانوی، فرانسیسی، جرمن، پرتگالی، اطالوی، روسی، اور مزید شامل ہیں۔ مخلوط زبان والی تصاویر سب سے بہتر کام کرتی ہیں جب آپ غالب زبان منتخب کریں۔

ہاتھ کی تحریر کے بارے میں کیا؟

ہاتھ کی تحریر کی شناخت کمزور ہے۔ Tesseract پرنٹ شدہ متن پر تربیت یافتہ ہے اور ترچھی یا گندی تحریر سے لڑتا ہے۔ پڑھنے کے قابل بلاک حرف ہاتھ کی تحریر قابل استعمال لیکن ناقص نتائج پیدا کرتی ہے؛ ترچھی عام طور پر بالکل کام نہیں کرتی۔

کیا آپ میری تصاویر یا نکالا گیا متن محفوظ کرتے ہیں؟

نہیں۔ ہم آپ کی چھوڑی گئی تصاویر یا OCR کے پیدا کردہ متن کو محفوظ نہیں کرتے۔ جیسے ہی آپ ٹیب بند یا ریفریش کرتے ہیں سب کچھ رد ہو جاتا ہے — کوئی لاگ نہیں، ہماری طرف سے اس بارے میں کوئی ریکارڈ نہیں کہ آپ نے کیا OCR کیا۔ آپ اپنے براؤزر کے ڈیولپر ٹولز سے تصدیق کر سکتے ہیں۔