PySpark cheat sheet 자료 - RDD, 데이터 처리

 

예전부터 잘 이용했던 Python의 여러 cheat sheet들이 있었다. PySpark도 좋은 cheat sheet 들이 있어서 정리 차원에서 포스팅.

 

PDF 문서 다운로드:

arif-cheatSheet_pyspark.pdf

pyspark-rdd-datacamp.pdf

 

 

PySpark cheat sheet - from Wenqiang

기존 pandas cheat sheet과 유사하고, 데이터 처리 부분 그림도 그려 주셔서 직관적으로 원하는 기능을 찾아 사용 가능하다.

 

arif.png

 

Datacamp에서 제공하는 pyspark 문서

마찬가지로, 기본 컨셉과 코드를 꼭 필요한 부분만 간략히 제공한다.

datacamp.png

 

 

 

참고링크

cheatSheet_pyspark.pdf (arif.works)

acfa4325-1d43-4542-8ce4-bea2d287db10 (datacamp-community-prod.s3.amazonaws.com)

No. Subject Author Date Views
Notice SQL강좌: 챗GPT와 함께 배우는 SQL Server 무료 강좌 목차와 소개 (2023년 9월 업데이트) 코난(김대우) 2023.08.18 36183
Notice Python 무료 강좌 - 기초, 중급, 머신러닝(2023년 6월 업데이트) 코난(김대우) 2021.01.01 18708
34 Azure Databricks - MLflow를 이용한 머신러닝(5) - Model 배포 file 코난(김대우) 2021.10.14 547
33 Azure Databricks - MLflow를 이용한 머신러닝(4) - Model Registry file 코난(김대우) 2021.10.12 386
32 Azure Databricks - MLflow를 이용한 머신러닝(3) - Project file 코난(김대우) 2021.10.08 364
31 Azure Databricks - MLflow를 이용한 머신러닝(2) - Tracking file 코난(김대우) 2021.10.08 475
30 Azure Databricks - MLflow를 이용한 머신러닝(1) file 코난(김대우) 2021.10.08 502
29 Azure Databricks - Spark에서 머신러닝 분산 처리 file 코난(김대우) 2021.10.07 198
» PySpark cheat sheet 자료 - RDD, 데이터 처리 file 코난(김대우) 2021.10.01 164
27 PySpark을 이용한 머신러닝 튜토리얼 예제 코난(김대우) 2021.10.01 947
26 Form Recognizer로 문서에서 표 데이터 추출 file 코난(김대우) 2021.01.21 410
25 MLaaS - 12가지의 머신러닝을 먼저 도입한 기업들의 고민 file 코난(김대우) 2021.01.15 800
24 Python 머신러닝 강좌 - 15. Matplotlib으로 데이터 시각화(visualization) file 코난(김대우) 2021.01.09 819
23 Python 머신러닝 강좌 - 14. NumPy와 Pandas 코난(김대우) 2021.01.09 768
22 Python 머신러닝 강좌 - 13. 모델의 정확도 평가(accuracy evaluating) 코난(김대우) 2021.01.09 1747
21 Python 머신러닝 강좌 - 12. 머신러닝 모델 테스트 코난(김대우) 2021.01.09 1066
20 Python 머신러닝 강좌 - 11. scikit-learn으로 선형회귀(linear regression) 모델 머신러닝 트레이닝 수행 코난(김대우) 2021.01.08 433
19 Python 머신러닝 강좌 - 10. 머신러닝을 위해 scikit-learn으로 트레이닝 데이터와 테스트 데이터 분할 코난(김대우) 2021.01.08 619
18 Python 머신러닝 강좌 - 9. 중복데이터와 결측값(missing value) 처리 코난(김대우) 2021.01.08 303
17 Python 머신러닝 강좌 - 8. Pandas DataFrame 컬럼(column) 분할(split)과 삭제(remove) 코난(김대우) 2021.01.08 449
16 Python 머신러닝 강좌 - 7. Pandas DataFrame으로 CSV 파일 읽고 쓰기 코난(김대우) 2021.01.08 615
15 Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북 file 코난(김대우) 2021.01.08 557





XE Login