Run Spark in Google Colab and connect the instance to Jupyter in VS Code on local machine

use the below code to get the colab session

!pip install jupyterlab pyngrok -q

!nohup jupyter lab --ip=0.0.0.0 &

from pyngrok import ngrok print(ngrok.connect(8888))

!apt-get install openjdk-8-jdk-headless -qq > /dev/null

!wget -q https://archive.apache.org/dist/spark/spark-3.0.0/spark-3.0.0-bin-hadoop3.2.tgz

!tar xf spark-3.0.0-bin-hadoop3.2.tgz

import os os.environ["JAVA_HOME"] = "/usr/lib/jvm/java-8-openjdk-amd64" os.environ["SPARK_HOME"] = "/content/spark-3.0.0-bin-hadoop3.2"

!pip install -q findspark !pip install pyspark

function KeepClicking(){ console.log("Clicking"); document.querySelector("colab-toolbar-button#connect").click() }setInterval(KeepClicking,60000)