Question 1

لماذا صوري PNG لا JPG؟

Accepted Answer

تحتفظ PNG بالشفافية وتتجنّب آثار إعادة الترميز. البكسلات نفسها مع الأصل؛ والملف أكبر لأن PNG غير ضائع. لتوفير المساحة مرّر النتيجة عبر /image-compress في وضع WebP.

Question 2

كيف أعرف من أي صفحة جاءت كل صورة؟

Accepted Answer

تتبع أسماء الملفات النمط `pageN-imgM.png` — حيث N رقم صفحة المصدر و M رقم تسلسلي داخل تلك الصفحة. رتّب حسب الاسم لرؤية ترتيب ظهورها في PDF.

Question 3

هل ستخرج الصور المشفَّرة مشوَّشة؟

Accepted Answer

لا تُشفَّر بيانات الصورة داخل PDF غير مشفَّر بشكل منفصل — تُفك بشكل طبيعي. أما إن كان PDF نفسه مشفَّرًا فلا يستطيع التطبيق قراءته أصلًا (انظر ملاحظة PDF المشفَّر أعلاه).

Question 4

لماذا العدد أكبر من الصور المرئية؟

Accepted Answer

تستخدم بعض ملفات PDF عدة XObjects للصور لكل صورة مرئية (مثلًا قناة alpha مخزَّنة كصورة رمادية منفصلة). يستخرجها v1 جميعًا — تجعل القناة المرنة (soft-mask) الصورة الرئيسية تبدو صحيحة عند التركيب، لكنها وحدها تظهر كصورة ظلية بالأبيض والأسود.

Question 5

هل يُرفَع PDF الخاص بي؟

Accepted Answer

لا. كل شيء يعمل في متصفحك — يحلل pdfjs-dist ملف PDF وتُعرَض البيتمابات عبر canvas، كلها على جانب العميل. لا تنطلق أي طلبات شبكة.

Question 6

ما حجم PDF الذي يمكنني الاستخراج منه؟

Accepted Answer

حتى نحو 100 ميغابايت من PDF قبل أن يبدأ المتصفح بالتباطؤ. الحد الصارم هو ذاكرة التبويب — إن نفدت الذاكرة أثناء الاستخراج فقسّم PDF عبر /pdf-split وعالج كل قسم بمفرده.

استخراج الصور من PDF

مشكلات شائعة