Question 1

ما صيغ الصور المدعومة؟

Accepted Answer

JPG وPNG وWebP وBMP. أي صيغة يستطيع متصفحك فكّ تشفيرها عبر Image API القياسي ستعمل. لصور HEIC من iPhone، حوّل أولاً إلى JPG بأداة HEIC إلى JPG.

Question 2

لماذا أول تشغيل بطيء؟

Accepted Answer

يحتاج Tesseract إلى نحو 4 ميجابايت من كود المحرك المُجمَّع و4 ميجابايت من بيانات نموذج اللغة عند أول استخدام. يُخزّن المتصفح كليهما، لذا تبدأ التشغيلات اللاحقة في أقل من ثانية. التعرف ذاته يأخذ عادةً 2–10 ثوانٍ للقطة نموذجية ويتناسب تقريباً مع حجم الصورة.

Question 3

ما مدى الدقة؟

Accepted Answer

على نص مطبوع نظيف بـ 300 DPI أو أعلى، الدقة عادة 95% أو أكثر. على لقطات المواقع عبر الهاتف تكون الدقة جيدة عادة لكنها قد تخطئ تفاصيل واجهة صغيرة. على الصور منخفضة الدقة أو المسوحات ذات الضوضاء أو الخط اليدوي، تنخفض الدقة كثيراً. نستخدم بيانات Tesseract السريعة — توازن جيد بين السرعة والدقة.

Question 4

هل يدعم النصوص غير الإنجليزية؟

Accepted Answer

نعم — اختر اللغة المناسبة من القائمة. أول OCR بتلك اللغة يُنزّل النموذج (3–14 ميجابايت) ويُخزّنه لاحقاً. اللغات المدعومة تشمل الكورية والصينية (المبسطة والتقليدية) واليابانية والعربية والهندية والإسبانية والفرنسية والألمانية والبرتغالية والإيطالية والروسية وغيرها. الصور متعددة اللغات تعمل بشكل أفضل عند اختيار اللغة السائدة.

Question 5

ماذا عن الخط اليدوي؟

Accepted Answer

التعرف على الخط اليدوي ضعيف. Tesseract مُدرَّب على النص المطبوع ويعاني مع الخط المتصل أو الفوضوي. الكتابة بحروف مطبعية مقروءة تعطي نتائج قابلة للاستخدام لكنها ليست مثالية؛ الخط المتصل عادة لا يعمل.

Question 6

هل تحفظون صوري أو النص المستخرج؟

Accepted Answer

لا. لا نحفظ الصور التي تُفلتها ولا النص الذي يُنتجه OCR. يُحذف كل شيء عند إغلاق التبويب أو إعادة تحميله — لا سجلات، ولا أثر لدينا لما قمت بـ OCR له. يمكنك التحقق عبر أدوات مطوّري المتصفح.

الصورة إلى نص — OCR داخل متصفحك

نصائح لنتائج أفضل

مثال

الأخطاء الشائعة والملاحظات