1. Pliki .http czyta VS Code + REST Client 2. Pobranie jar-a: wget https://repo1.maven.org/maven2/org/elasticsearch/elasticsearch-spark-20_2.11/7.5.2/elasticsearch-spark-20_2.11-7.5.2.jar 3. Link do Movielens: https://grouplens.org/datasets/movielens/ 4. Uruchomienie pyspark-a pyspark --jars ./elasticsearch-spark-20_2.11-7.5.2.jar
zorteran/wiadro-danych-spark-elasticsearch
Materiały do wpisu https://wiadrodanych.pl/big-data/spark/elasticsearch-spark/
Jupyter Notebook