Instrukcja laboratoryjna
Cele
- Zapoznanie się z modułami Spark SQL i MLlib.
Opis
Notatnik wykorzystuje dane z zewnętrznego pliku. Zostały one już wcześniej umieszczone na platformie.
Notatnik
- Zainicjować nowy klaster obliczeniowy
- Zaimportować i uruchomić notatnik z URL:
https://raw.githubusercontent.com/khozzy/pwr-hadoop/master/spark/notebooks/databricks/lab14.ipynb
- Zapoznać się z treścią oraz wykonać zadania.
Materiały pomocnicze