الصورة إلى نص — OCR داخل متصفحك
استخرج النص من الصور ولقطات الشاشة والمستندات الممسوحة ضوئياً. يعمل Tesseract OCR بالكامل داخل متصفحك — لا يُرفع أي شيء.
- أفلت صورة واحدة أو عدة صور، أو اضغط تصفح — JPG وPNG وWebP وBMP مدعومة.
- إذا لم يكن النص بالإنجليزية، اختر اللغة المناسبة — أول تشغيل بهذه اللغة يُنزّل النموذج (3–14 ميجابايت)، ثم يُخزّنه المتصفح للمرات اللاحقة.
- اضغط "استخراج الكل". في أول تشغيل يتم تنزيل نحو 8 ميجابايت من محرك OCR وبيانات اللغة من هذا الموقع (يُخزّنها متصفحك لاستخدامها لاحقاً، وتُعاد في كل صورة ضمن الدفعة).
- تظهر نتيجة أول صورة في المعاينة أدناه. نزّل نص كل صورة من صفها، أو انسخ ناتج جميع الملفات إلى الحافظة، أو احصل على ملف .txt مُدمج.
ماذا تفعل؟
OCR (التعرف الضوئي على الحروف) يحوّل البكسلات التي تبدو كنص إلى نص حقيقي. يستخدم هذا الأداة Tesseract — محرك OCR مفتوح المصدر الذي تشرف عليه Google — المُجمَّع إلى WebAssembly. يعمل بشكل أفضل مع النص المطبوع؛ التعرف على الخط اليدوي أضعف.
نصائح لنتائج أفضل
- تباين عالٍ بين النص والخلفية.
- صور غير مائلة — إذا كانت الصورة جانبية أو مائلة فدوّرها أولاً بأداة قص الصور.
- 300 DPI أو أعلى للمستندات الممسوحة.
- النص المطبوع يعمل أفضل بكثير من الخط اليدوي.
- للملفات PDF متعددة الصفحات، حوّلها أولاً إلى صور بأداة "PDF إلى JPG / PNG" ثم طبّق OCR لكل صفحة، أو استخدم أداة "PDF إلى نص" المخصصة.
مثال
الإدخال — لقطة JPG لبطاقة شحن بالإنجليزية. منطقة نص الإخراج:
SHIP TO:
Jane Doe
123 Main Street
Springfield, IL 62701
USA
TRACKING: 1Z 999 AA1 0123 4567 89
WEIGHT: 2.4 lbs
SHIPPED: 2026-04-12 الأخطاء الشائعة والملاحظات
معظم خيبات OCR مصدرها الصورة نفسها لا المحرك. الصورة السيئة لا تُستعاد بإعداد أكثر تعقيداً.
- مخرج مشوّش على صورة منخفضة الدقة. لقطات الهاتف والصور المصغّرة الصغيرة تعطي نصاً مشوّشاً. أعد التقاط الصورة من مسافة أقرب، أو استخدم الملف الأصلي بالدقة الكاملة إن وُجد.
- الصورة مُدارة 90° أو مقلوبة. لا يقوم Tesseract بالتدوير التلقائي. صحّح الاتجاه أولاً بأداة قص الصور، ثم أعد المحاولة.
- الأعمدة متداخلة في المخرج. يقرأ OCR بالترتيب الطبيعي للمسح وقد يخلط بين التخطيطات متعددة الأعمدة. قص الصورة حسب الأعمدة أولاً ثم طبّق OCR لكل عمود على حدة.
- الخط اليدوي يخرج بشكل خاطئ. Tesseract مُدرَّب على النص المطبوع ويعاني مع الخط المتصل أو الفوضوي. الكتابة بحروف مطبعية مقروءة تعطي نتائج قابلة للاستخدام لكنها ليست مثالية أبداً — توقع بعض التنقيح اليدوي.
- النص غير الإنجليزي يخرج عبارة عن رموز. ترك منتقي اللغة على الإنجليزية عند OCR كوري أو عربي أو صيني يعطي نتائج تبدو عشوائية. اختر اللغة المناسبة من القائمة قبل الاستخراج.
- تجمد التبويب على صورة ضخمة. الصور التي تتجاوز 20 ميجابكسل قد تستنزف الذاكرة أثناء التعرف. اقتصّ المنطقة التي تهمك بأداة قص الصور، أو قلّل الحجم أولاً بأداة ضغط الصور.
الأسئلة الشائعة
ما صيغ الصور المدعومة؟
JPG وPNG وWebP وBMP. أي صيغة يستطيع متصفحك فكّ تشفيرها عبر Image API القياسي ستعمل. لصور HEIC من iPhone، حوّل أولاً إلى JPG بأداة HEIC إلى JPG.
لماذا أول تشغيل بطيء؟
يحتاج Tesseract إلى نحو 4 ميجابايت من كود المحرك المُجمَّع و4 ميجابايت من بيانات نموذج اللغة عند أول استخدام. يُخزّن المتصفح كليهما، لذا تبدأ التشغيلات اللاحقة في أقل من ثانية. التعرف ذاته يأخذ عادةً 2–10 ثوانٍ للقطة نموذجية ويتناسب تقريباً مع حجم الصورة.
ما مدى الدقة؟
على نص مطبوع نظيف بـ 300 DPI أو أعلى، الدقة عادة 95% أو أكثر. على لقطات المواقع عبر الهاتف تكون الدقة جيدة عادة لكنها قد تخطئ تفاصيل واجهة صغيرة. على الصور منخفضة الدقة أو المسوحات ذات الضوضاء أو الخط اليدوي، تنخفض الدقة كثيراً. نستخدم بيانات Tesseract السريعة — توازن جيد بين السرعة والدقة.
هل يدعم النصوص غير الإنجليزية؟
نعم — اختر اللغة المناسبة من القائمة. أول OCR بتلك اللغة يُنزّل النموذج (3–14 ميجابايت) ويُخزّنه لاحقاً. اللغات المدعومة تشمل الكورية والصينية (المبسطة والتقليدية) واليابانية والعربية والهندية والإسبانية والفرنسية والألمانية والبرتغالية والإيطالية والروسية وغيرها. الصور متعددة اللغات تعمل بشكل أفضل عند اختيار اللغة السائدة.
ماذا عن الخط اليدوي؟
التعرف على الخط اليدوي ضعيف. Tesseract مُدرَّب على النص المطبوع ويعاني مع الخط المتصل أو الفوضوي. الكتابة بحروف مطبعية مقروءة تعطي نتائج قابلة للاستخدام لكنها ليست مثالية؛ الخط المتصل عادة لا يعمل.
هل تحفظون صوري أو النص المستخرج؟
لا. لا نحفظ الصور التي تُفلتها ولا النص الذي يُنتجه OCR. يُحذف كل شيء عند إغلاق التبويب أو إعادة تحميله — لا سجلات، ولا أثر لدينا لما قمت بـ OCR له. يمكنك التحقق عبر أدوات مطوّري المتصفح.