- pandoc:
- Arch:
sudo pacman -S pandoc
- Debian:
sudo apt-get install pandoc
- PyMuPDF:
pip3 install pymupdf
cd scripts && ./install_scripts.sh
strip.py <pdf>
pandoc.sh <md>
- Resaltar todos los H1
- Resaltar todos los H2
- Resaltar todos los H3
- Generar markdown usando el pdf resaltado y crear pdf en base al markdown
python -m highext <pdf>
pandoc.sh <md_output>
- Revisar y corregir de ser necesario:
- Estructura de títulos de la tabla de contenidos.
- Títulos o temas repetidos
- Resaltar los H4 y el texto normal.
- Crear copia del pdf original sin resaltar
- Resaltar la copia siguiendo los pasos del caso general
Cada vez que se resuma algo pushear las siguientes cosas:
Contenido | Ubicacion | Relevancia |
---|---|---|
PDF resaltado | material/ | Importane! |
Markdown extraido del pdf | apuntes/ | Opcional |
PDF generado en base al markdown | apuntes/ | Opcional |
- Obtener solo las páginas resaltadas del pdf:
strip.py <pdf>
- Cambiar nombre del pdf recortado para que diga que capitulos contiene.
- Seguir pasos del caso general.