Schnellstart mit Apache Spark unter macOS
Öffne dein Terminal.
Installiere Homebrew mit folgendem Befehl und folge den Anweisungen:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Installiere Apache Spark mit folgendem Befehl:
brew install apache-spark
Starte Spark mit folgendem Befehl:
spark-shell
Die Funktionalität von Spark kann nun zum Beispiel mit dem Laden einer CSV-Datei getestet werden. Gegeben, dass die Datei
/Users/username/Downloads/hdi.csv
(username
anpassen, die CSV bekommst du hier bei Kaggle) existiert, valide ist und mit Headern ausgestattet ist, lässt diese sich dann mit folgendem Befehl laden:val df = spark.read.csv("/Users/username/Downloads/hdi.csv", header=True)
Und dann mit folgendem Befehl ausgeben:df.show()
Mehr Beispiele findet man auf GitHub.