PySpark cheat sheet 자료 - RDD, 데이터 처리

 

예전부터 잘 이용했던 Python의 여러 cheat sheet들이 있었다. PySpark도 좋은 cheat sheet 들이 있어서 정리 차원에서 포스팅.

 

PDF 문서 다운로드:

arif-cheatSheet_pyspark.pdf

pyspark-rdd-datacamp.pdf

 

 

PySpark cheat sheet - from Wenqiang

기존 pandas cheat sheet과 유사하고, 데이터 처리 부분 그림도 그려 주셔서 직관적으로 원하는 기능을 찾아 사용 가능하다.

 

arif.png

 

Datacamp에서 제공하는 pyspark 문서

마찬가지로, 기본 컨셉과 코드를 꼭 필요한 부분만 간략히 제공한다.

datacamp.png

 

 

 

참고링크

cheatSheet_pyspark.pdf (arif.works)

acfa4325-1d43-4542-8ce4-bea2d287db10 (datacamp-community-prod.s3.amazonaws.com)

No. Subject Author Date Views
Notice 2023년 1월 - SQLER의 업데이트 강좌 리스트 코난(김대우) 2023.01.02 2148
33 Azure Databricks - MLflow를 이용한 머신러닝(4) - Model Registry file 코난(김대우) 2021.10.12 214
32 Azure Databricks - MLflow를 이용한 머신러닝(3) - Project file 코난(김대우) 2021.10.08 214
31 Azure Databricks - MLflow를 이용한 머신러닝(2) - Tracking file 코난(김대우) 2021.10.08 243
30 Azure Databricks - MLflow를 이용한 머신러닝(1) file 코난(김대우) 2021.10.08 274
29 Azure Databricks - Spark에서 머신러닝 분산 처리 file 코난(김대우) 2021.10.07 114
» PySpark cheat sheet 자료 - RDD, 데이터 처리 file 코난(김대우) 2021.10.01 100
27 PySpark을 이용한 머신러닝 튜토리얼 예제 코난(김대우) 2021.10.01 735
26 Form Recognizer로 문서에서 표 데이터 추출 file 코난(김대우) 2021.01.21 312
25 MLaaS - (1) 12가지의 머신러닝을 먼저 도입한 기업들의 고민 file 코난(김대우) 2021.01.15 624
24 Python 머신러닝 강좌 - 15. Matplotlib으로 데이터 시각화(visualization) file 코난(김대우) 2021.01.09 550
23 Python 머신러닝 강좌 - 14. NumPy와 Pandas 코난(김대우) 2021.01.09 528
22 Python 머신러닝 강좌 - 13. 모델의 정확도 평가(accuracy evaluating) 코난(김대우) 2021.01.09 1126
21 Python 머신러닝 강좌 - 12. 머신러닝 모델 테스트 코난(김대우) 2021.01.09 675
20 Python 머신러닝 강좌 - 11. scikit-learn으로 선형회기(linear regression) 모델 머신러닝 트레이닝 수행 코난(김대우) 2021.01.08 267
19 Python 머신러닝 강좌 - 10. 머신러닝을 위해 scikit-learn으로 트레이닝 데이터와 테스트 데이터 분할 코난(김대우) 2021.01.08 387
18 Python 머신러닝 강좌 - 9. 중복데이터와 결측값(missing value) 처리 코난(김대우) 2021.01.08 187
17 Python 머신러닝 강좌 - 8. Pandas DataFrame 컬럼(column) 분할(split)과 삭제(remove) 코난(김대우) 2021.01.08 281
16 Python 머신러닝 강좌 - 7. Pandas DataFrame으로 CSV 파일 읽고 쓰기 코난(김대우) 2021.01.08 250
15 Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북 file 코난(김대우) 2021.01.08 295
14 Python 머신러닝 강좌 - 5. Pandas DataFrame에 질의(Query) 코난(김대우) 2021.01.07 207





XE Login