/tabula_linux

this is a short intro on how to use tabula with linux

Введение в tabula под Linux

Это краткое введение о том, как использовать tabula под Linux. Это не о том, как tabula использовать, a просто как установите его и запустите под Linux.

Что такое tabula?

Tabula - отличный инструмент для экстракции данных из PDF-файлов.

3апустить под Linux

  1. Установка под Linux: Во-первых, убедитесь, что у вас установлена Java. Проверьте, установлена ли у вас Java и какая версия со следующей командой java -version. Если нету, или версия не актуальная, то вы можете использовать команду sudo apt install default-jdk для установки. Вам нужна эта программа, потому что tabula выполняется через Java.

  2. Прежде всего, вам нужно скачать tabula. На этом сайте есть краткий обзор. Там же находится прямая ссылка на актуальную версию tabula-jar.zip. А затем распакуйте ZIP-файл в для вас нужное место.

  3. Откройте терминал, и перемещайтесь с помощью cd в папку в которую вы только что распаковали tabula. Затем вы можете запустить tabula со следующей командой java -Dfile.encoding=utf-8 -Xms256M -Xmx1024M -jar tabula.jar

  4. Затем введите в браузере http://127.0.0.1:8080/. Cтандартна tabula открывается в портe 8080. Если вы хотите, чтобы tabula открывалась автоматически в browser, введите это как опцию в команде. Для этого нужно добавить следующую строку -Dtabula.openBrowser=true. Это будет выглядеть вот так -Dfile.encoding=utf-8 -Dtabula.openBrowser=true -Xms256M -Xmx1024M -jar tabula.jar.

И если вы также хотите изменить порт, по которому запускается tabula в браузерe, вы можете добавить эту дополнительную опцию -Dwarbler.port=2222. Bыглядеть будет это вот так java -Dfile.encoding=utf-8 -Xms256M -Xmx1024M -Dwarbler.port=2222 -jar tabula.jar.

И это уже и всё. Теперь вы можете работать с tabula в браузере под Linux. Если вы хотите знать, как именно использовать, тогда я могу порекомендовать это видео от "Важные истории" для начала.