Язык: Русский Перейти на английский

Сравнение PDF

Перетащите две версии PDF и увидите визуальный диф постранично. Работает в вашем браузере — файлы никогда не покидают устройство.

Перетащите PDF A или
Перетащите PDF B или
  1. Перетащите PDF A (более старую или эталонную версию) слева.
  2. Перетащите PDF B (более новую или кандидатскую версию) справа.
  3. Выберите DPI и порог сходства (значения по умолчанию подходят для большинства случаев).
  4. Нажмите Сравнить. Прокрутите постраничный диф бок о бок.
Что это делает?

Каждая страница A и B рендерится в растр на выбранном DPI. Инструмент проходит попиксельно по обоим рендерам; любой пиксель, чьё RGB-расстояние превышает порог, помечается красным на диф-изображении. Страницы, которые не перекрываются (если количество страниц различается), отмечаются в сводке и пропускаются.

Пример

Compare: contract-v4.pdf (12 pages) vs contract-v5.pdf (12 pages)
DPI:     100
Output:  3 pages differ, 9 identical.
         Page 7: 4.2% of pixels changed
         Page 8: 0.8% of pixels changed
         Page 11: 11.6% of pixels changed

Частые ошибки и подводные камни

Большинство проблем связано с тем, как PDF рендерятся, а не с реальными различиями в содержимом. Сводная строка показывает, что нашёл инструмент.

  • "Идентичные" PDF показывают различия. Два PDF могут отрендерить одну страницу с разным сглаживанием или хинтингом шрифтов — визуально идентично, попиксельно разно. Поднимите ползунок порога до 12–16, чтобы отфильтровать невидимые различия.
  • Нехватка памяти на больших документах при высоком DPI. Каждая отрендеренная страница при 300 DPI на странице формата Letter это ~2500×3300 = 33 MB данных холста, умножить на три (A, B, diff), умножить на каждую страницу. Держите DPI на 100 для всего, что больше 50 страниц.
  • Различия в повороте или масштабе. Если одна PDF имеет повёрнутые страницы или другой размер страницы, инструмент сравнивает по пиксельному выравниванию и всё выглядит иначе. Нормализуйте геометрию страниц сначала инструментом PDF Rotate или PDF Organizer.
  • Зашифрованный PDF. Защищённые паролем PDF отклоняются. Откройте файл в любом PDF-просмотрщике, удалите пароль через File > Save As и снова перетащите незащищённую копию.
  • Разное количество страниц. Если у A 12 страниц, а у B 10, инструмент сравнивает первые 10 страниц и отмечает лишние в сводке. Лишние страницы не теряются, им просто не с чем сравниваться.
  • Перетащен не тот файл. "Not a PDF — drop a .pdf file." Файл .docx или .pages отклоняется. Сначала конвертируйте в PDF — инструмент принимает только настоящие PDF.
Часто задаваемые вопросы

Это текстовый диф или визуальный?

Визуальный диф. Каждая страница каждого PDF рендерится в растр на выбранном DPI, и каждый пиксель, отличающийся между ними, подсвечивается красным. Это ловит изменения макета, замены изображений, подстановки шрифтов и правки содержимого — всё видимое. Для текстового дифа извлеките текст из каждого PDF через /pdf-to-text и вставьте в /diff-checker.

Какой DPI использовать?

100 DPI по умолчанию — быстро и ловит большинство значимых различий. Поднимите до 150 для более тонких изменений (сдвиги линий на 1 пиксель). 200+ в основном трата времени, если только вы не сравниваете очень детализированные технические чертежи.

Что происходит, если у двух PDF разное количество страниц?

Инструмент сравнивает пересекающийся диапазон страниц и отмечает лишние страницы в сводной строке ("A has 12 pages, B has 10 — comparing pages 1–10"). Лишние страницы не теряются, они просто ни с чем не сравниваются.

Почему моя "идентичная" страница показывает различия?

PDF могут кодировать одну и ту же видимую страницу по-разному — встраивание шрифтов, сжатие изображений или подсказки сглаживания — что даёт различия на уровне пикселей при рендеринге, даже когда содержимое выглядит идентично. Поднимите ползунок порога сходства или полагайтесь на процент, а не на красные пиксели.

Могу ли я сравнивать зашифрованные или защищённые паролем PDF?

Нет. Откройте файл в любом PDF-просмотрщике, удалите пароль через File > Save As и снова перетащите незащищённую копию. Инструмент отклоняет зашифрованные файлы, чтобы не рендерить молча только те части, которым не нужен пароль.

Сохраняете ли вы PDF, которые я здесь сравниваю?

Нет. Мы не сохраняем PDF, которые вы перетаскиваете, отрендеренные изображения или результат дифа. Всё отбрасывается в момент закрытия или обновления вкладки. Можете проверить в инструментах разработчика своего браузера.