/CleanHTML

Script para limpieza de HTML's para la red SciELO

Primary LanguageShell

CleanHTML

Información

Este script ayuda a la limpieza de código en archivos HTML generados a partir un documento PDF con programas como:

  • Adobe Acrobat Pro
  • Adobe InDesign
  • ABBYY PDF Transformer

Dando como resultado un HTML con las etiquetas aceptadas por SciELO.

Requisitos (Unicamente Windows)

Descargar cygwin.exe, al terminar la descarga solo basta con ejecutar el archivo y este instalará los archivo necesarios en la unidad "C:" de nuestro sistema operativo (Windows)

Instalación

Metodo 1 Descarga

Descargar y extraer el contenido del archivo CleanHTML.zip

Metodo 2 GitHub (Recomendado)

Realizar una copia del repositorio git clone git@github.com:swarzesherz/CleanHTML.git

Mantenerlo actualizado git pull origin master

Uso

Windows

  • Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
  • Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
  • Ejecutar el archivo "CleanHTML.cmd" que se encuentra en la carpeta de instalación

OSX

  • Dar clic secundario en el archivo "CleanHTMLOSX.sh" y seleccionar obtener información
  • En la opción "Abrir con:" seleccionamos de la lista "Otro..." y asignamos Aplicaciones -> Utilidades -> Terminal. (Si no permite seleccionarla hay que activar la opcion "Habilitar: Todas")
  • Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
  • Crear una carpeta llamada "body" (todo en minúsculas) dentro de la carpeta de instalación (CleanHTML)
  • Ejecutar el archivo "CleanHTMLOSX.sh" que se encuentra en la carpeta de instalación

NOTA: Los dos primeros puntos sólo se realizan una vez en caso de que el archivo no tenga como aplicación predeterminada una terminal