공부기록

스파크에 파이썬 프로젝트 서브밋하기 본문

일단써

스파크에 파이썬 프로젝트 서브밋하기

코타쿠 2023. 4. 21. 16:18

https://spark.apache.org/docs/latest/api/python/user_guide/python_packaging.html?highlight=submit%20python 

 

Python Package Management — PySpark 3.4.0 documentation

Python Package Management When you want to run your PySpark application on a cluster such as YARN, Kubernetes, Mesos, etc., you need to make sure that your code and all used libraries are available on the executors. As an example, let’s say you may want

spark.apache.org

 

export PYSPARK_PYTHON=./environment/bin/python

 

명령어는 제출하는 잡의 환경을 사용하겠다는 말이다. 저렇게 해줘야 프로젝트의 의존성 사용할 있음.