/pdf

Primary LanguageC++

My pdf manipulation library and utilities

tabulator.exe

Вытаскивалка таблиц с интерфейсом из командной строки.

tabulator.exe -p16-21 -R2 -fe -E2 dium_201007_fi.pdf

-p - страницы с 16й по 21ю включительно -R - добавлять горизонтальные линии по тексту из 2-ной колонки -fe - результат пихать в Excel -E2 - для "широких" таблиц - две страницы в ширину (число страниц в интервале должно быть кратным этому числу) -S2 - Попытаться разбить вторую колонку на два (отделить параграфы от названий, нормально работает только если колонка параграфов выровнена влево)

-J и -P можно попробовать если получается что-то слишком кривое, возможно от них станет лучше :-)

wxtab.exe

То же самое с графическим интерфейсом, может вытаскивать только одну страницу и не умеет разбивать колонки. Удобно для подбора параметра -R

wxview.exe

Смотрелка PDF (кусок wxtab, рисующий документ, практическая польза стремится к нулю).

pdfdig.exe

Штука с графическим интерфейсом для копания в PDF-файлах.

dump_object.exe

Вытаскивание из файла PDF указанного объекта (по номеру) или описания страницы.