Máquina virtual mínima con Anaconda3 5.3, Hadoop 3.1.1 y Spark 2.3.2 en Ubuntu 18.04 LTS
Antes de nada instalar VirtualBox (https://www.virtualbox.org/wiki/Downloads) y vagrant (https://www.vagrantup.com/downloads.html).
- Descargar la carpeta en vuestro equipo
- Abrir un terminal y acceder a la carpeta que acabáis de descargar
$ vagrant up
$ vagrant ssh
- A partir de este momento estaréis dentro de la máquina virtual en modo consola. La carpeta
/vagrant
de la máquina virtual es una carpeta compartida que está sincronizada con la carpeta de la máquina anfitriona que contiene el ficheroVagrantfile
(es decir, la carpeta en la que habéis ejecutado los comandos). Podéis usar los ejemplos en/vagrant/hadoop
y/vagrant/spark
para probar que todo funciona. Todos los binarios (pyspark
,spark-submit
,python
, etc.) están en elPATH
.
Si estos pasos fallan, realizar los pasos de manera manual:
- Descargar la carpeta en vuestro equipo.
- Eliminar el fichero
Vagrantfile
- Abrir un terminal y acceder a la carpeta que acabáis de descargar
$ vagrant init ubuntu/bionic64
$ vagrant up
$ vagrant ssh
$ /vagrant/provision.sh
$ source .bashrc
Importante: salir siempre de manera limpia de la máquina virtual:
$ exit
$ vagrant halt