Question 1

なぜ画像は JPG ではなく PNG なのですか？

Accepted Answer

PNG は透明度を保持し、再エンコーディングのアーティファクトを避けます。ピクセルは元と同じです。PNG はロスレスのため、ファイルが大きくなります。容量を節約するには、結果を WebP モードで /image-compress を通してください。

Question 2

各画像がどのページから来たかをどう判断しますか？

Accepted Answer

ファイル名はパターン `pageN-imgM.png` に従います — N はソースページ番号、M はそのページ内のシーケンス番号です。PDF に表示される順序を見るには、ファイル名でソートしてください。

Question 3

暗号化された画像はスクランブルされて出てきますか？

Accepted Answer

暗号化されていない PDF 内の画像データは別途暗号化されておらず — 通常通りデコードされます。PDF 自体が暗号化されている場合、ツールはそれを全く読み取れません（上記の暗号化 PDF の注を参照）。

Question 4

なぜカウントが表示される画像より多いのですか？

Accepted Answer

一部の PDF は表示される画像ごとに複数の画像 XObjects を使用します（例：別のグレースケール画像として保存されたソフトマスクのアルファチャンネル）。v1 はそれぞれを抽出します — ソフトマスクは合成時にメイン画像を正しく見せるものですが、それ単独では白黒のシルエットとして表示されます。

Question 5

私の PDF はアップロードされますか？

Accepted Answer

いいえ。すべてはブラウザで実行されます — PDF は pdfjs-dist によって解析され、画像ビットマップはキャンバスを介してレンダリングされ、すべてクライアントサイドです。ネットワーク要求は発生しません。

Question 6

どのくらい大きな PDF から抽出できますか？

Accepted Answer

ブラウザが遅く感じ始めるまで約 100 MB の PDF まで。ハードリミットはタブのメモリです — 抽出が OOM したら、/pdf-split で PDF を分割し、各セクションを個別に実行してください。

PDF から画像を抽出

一般的な問題