Сравнение PDF
Перетащите две версии PDF и увидите визуальный диф постранично. Работает в вашем браузере — файлы никогда не покидают устройство.
- Перетащите PDF A (более старую или эталонную версию) слева.
- Перетащите PDF B (более новую или кандидатскую версию) справа.
- Выберите DPI и порог сходства (значения по умолчанию подходят для большинства случаев).
- Нажмите Сравнить. Прокрутите постраничный диф бок о бок.
Что это делает?
Каждая страница A и B рендерится в растр на выбранном DPI. Инструмент проходит попиксельно по обоим рендерам; любой пиксель, чьё RGB-расстояние превышает порог, помечается красным на диф-изображении. Страницы, которые не перекрываются (если количество страниц различается), отмечаются в сводке и пропускаются.
Пример
Compare: contract-v4.pdf (12 pages) vs contract-v5.pdf (12 pages)
DPI: 100
Output: 3 pages differ, 9 identical.
Page 7: 4.2% of pixels changed
Page 8: 0.8% of pixels changed
Page 11: 11.6% of pixels changed Частые ошибки и подводные камни
Большинство проблем связано с тем, как PDF рендерятся, а не с реальными различиями в содержимом. Сводная строка показывает, что нашёл инструмент.
- "Идентичные" PDF показывают различия. Два PDF могут отрендерить одну страницу с разным сглаживанием или хинтингом шрифтов — визуально идентично, попиксельно разно. Поднимите ползунок порога до 12–16, чтобы отфильтровать невидимые различия.
- Нехватка памяти на больших документах при высоком DPI. Каждая отрендеренная страница при 300 DPI на странице формата Letter это ~2500×3300 = 33 MB данных холста, умножить на три (A, B, diff), умножить на каждую страницу. Держите DPI на 100 для всего, что больше 50 страниц.
- Различия в повороте или масштабе. Если одна PDF имеет повёрнутые страницы или другой размер страницы, инструмент сравнивает по пиксельному выравниванию и всё выглядит иначе. Нормализуйте геометрию страниц сначала инструментом PDF Rotate или PDF Organizer.
- Зашифрованный PDF. Защищённые паролем PDF отклоняются. Откройте файл в любом PDF-просмотрщике, удалите пароль через File > Save As и снова перетащите незащищённую копию.
- Разное количество страниц. Если у A 12 страниц, а у B 10, инструмент сравнивает первые 10 страниц и отмечает лишние в сводке. Лишние страницы не теряются, им просто не с чем сравниваться.
- Перетащен не тот файл. "Not a PDF — drop a .pdf file." Файл .docx или .pages отклоняется. Сначала конвертируйте в PDF — инструмент принимает только настоящие PDF.
Часто задаваемые вопросы
Это текстовый диф или визуальный?
Визуальный диф. Каждая страница каждого PDF рендерится в растр на выбранном DPI, и каждый пиксель, отличающийся между ними, подсвечивается красным. Это ловит изменения макета, замены изображений, подстановки шрифтов и правки содержимого — всё видимое. Для текстового дифа извлеките текст из каждого PDF через /pdf-to-text и вставьте в /diff-checker.
Какой DPI использовать?
100 DPI по умолчанию — быстро и ловит большинство значимых различий. Поднимите до 150 для более тонких изменений (сдвиги линий на 1 пиксель). 200+ в основном трата времени, если только вы не сравниваете очень детализированные технические чертежи.
Что происходит, если у двух PDF разное количество страниц?
Инструмент сравнивает пересекающийся диапазон страниц и отмечает лишние страницы в сводной строке ("A has 12 pages, B has 10 — comparing pages 1–10"). Лишние страницы не теряются, они просто ни с чем не сравниваются.
Почему моя "идентичная" страница показывает различия?
PDF могут кодировать одну и ту же видимую страницу по-разному — встраивание шрифтов, сжатие изображений или подсказки сглаживания — что даёт различия на уровне пикселей при рендеринге, даже когда содержимое выглядит идентично. Поднимите ползунок порога сходства или полагайтесь на процент, а не на красные пиксели.
Могу ли я сравнивать зашифрованные или защищённые паролем PDF?
Нет. Откройте файл в любом PDF-просмотрщике, удалите пароль через File > Save As и снова перетащите незащищённую копию. Инструмент отклоняет зашифрованные файлы, чтобы не рендерить молча только те части, которым не нужен пароль.
Сохраняете ли вы PDF, которые я здесь сравниваю?
Нет. Мы не сохраняем PDF, которые вы перетаскиваете, отрендеренные изображения или результат дифа. Всё отбрасывается в момент закрытия или обновления вкладки. Можете проверить в инструментах разработчика своего браузера.