Question 1

Pourquoi mes images sont-elles PNG, pas JPG ?

Accepted Answer

PNG préserve la transparence et évite les artefacts de ré-encodage. Les pixels sont les mêmes que l'original ; le fichier est plus grand parce que PNG est sans perte. Pour économiser l'espace, faites passer le résultat par /image-compress en mode WebP.

Question 2

Comment savoir de quelle page chaque image vient ?

Accepted Answer

Les noms de fichiers suivent le motif `pageN-imgM.png` — N est le numéro de page source, M est un numéro de séquence dans cette page. Triez par nom de fichier pour voir l'ordre où elles apparaissent dans le PDF.

Question 3

Les images chiffrées sortiront-elles brouillées ?

Accepted Answer

Les données d'image à l'intérieur d'un PDF non chiffré ne sont pas chiffrées séparément — elles se décodent normalement. Si le PDF lui-même est chiffré, l'outil ne peut pas le lire du tout (voir la note sur les PDFs chiffrés ci-dessus).

Question 4

Pourquoi le compte est-il plus élevé que les images visibles ?

Accepted Answer

Certains PDFs utilisent plusieurs XObjects d'image par image visible (par ex., un canal alpha soft-mask stocké comme une image en niveaux de gris séparée). v1 extrait chacun — le soft-mask est ce qui rend l'image principale correcte lors de la composition, mais seul il apparaît comme une silhouette noir et blanc.

Question 5

Mon PDF est-il téléchargé ?

Accepted Answer

Non. Tout s'exécute dans votre navigateur — votre PDF est parsé par pdfjs-dist et les bitmaps d'image sont rendus via canvas, tout côté client. Aucune requête réseau ne se déclenche.

Question 6

Quelle taille de PDF puis-je extraire ?

Accepted Answer

Jusqu'à environ 100 Mo de PDF avant que le navigateur ne commence à se sentir lent. La limite stricte est la mémoire de votre onglet — si l'extraction OOM, divisez le PDF via /pdf-split et exécutez chaque section séparément.

Extraire les images du PDF

Problèmes courants