PySpark cheat sheet 자료 - RDD, 데이터 처리
예전부터 잘 이용했던 Python의 여러 cheat sheet들이 있었다. PySpark도 좋은 cheat sheet 들이 있어서 정리 차원에서 포스팅.
PDF 문서 다운로드:
PySpark cheat sheet - from Wenqiang
기존 pandas cheat sheet과 유사하고, 데이터 처리 부분 그림도 그려 주셔서 직관적으로 원하는 기능을 찾아 사용 가능하다.
Datacamp에서 제공하는 pyspark 문서
마찬가지로, 기본 컨셉과 코드를 꼭 필요한 부분만 간략히 제공한다.
참고링크
cheatSheet_pyspark.pdf (arif.works)
acfa4325-1d43-4542-8ce4-bea2d287db10 (datacamp-community-prod.s3.amazonaws.com)