사전준비
- 스파크를 설치하는 과정은 소개 하려고 한다.
- 사전에 파이썬 3만 설치가 되어 있으면 된다.
- 만약, 파이썬이 처음이라면 Anaconda를 설치한다.
다운로드 전 필수 확인사항
- 스파크 설치 전에는 반드시 체크해야 하는 사항이 있다. (System Compatibility)
- 2022년 1월 기준은 아래와 같다.
Get Spark from the downloads page of the project website. This documentation is for Spark version 3.2.0. Spark uses Hadoop’s client libraries for HDFS and YARN. Downloads are pre-packaged for a handful of popular Hadoop versions. Users can also download a “Hadoop free” binary and run Spark with any Hadoop version by augmenting Spark’s classpath. Scala and Java users can include Spark in their projects using its Maven coordinates and Python users can install Spark from PyPI.