2023년 6월 업데이트

 

안녕하세요. SQLER의 코난 김대우입니다. 

이번 강좌에서는, Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북을 진행토록 하겠습니다.

 

SQLER에서 진행되는 전체 Python / 머신러닝 강좌 목록

 

코드를 실행하기 위해서는, vscode에서 새로운 파일을 만들고 강좌 내용을 단계별로 copy&paste 해서 실행하시면 됩니다. 또는, Jupyter notebook을 실행하고 단계별로 실행하셔도 됩니다.

 

상세한 환경 구성이 필요하시다면, 개발자 커뮤니티 SQLER.com - Python 초급 강좌 목차 - 1. Python 개발 환경 구성 문서를 참조해 WSL, vscode, conda, jupyter notebook 설정을 모두 먼저 완료하시길 권장해 드립니다.

 

 

TL;DR

CSV(쉼표로 구분된 값) 파일은 일반적으로 데이터 저장에 사용되며, 각 행은 레코드를 나타내고 열은 쉼표로 구분합니다. CSV 파일을 Jupyter Notebook에 업로드하려면 원하는 위치에 디렉토리를 생성하고 "업로드" 버튼을 사용하여 파일을 선택하여 업로드합니다.
 

 

Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북

 

데이터파일을 로드하는 경우가 많습니다. 일반적인 경우 CSV가 가장 많이 사용되는 파일 포맷이고, 이 CSV 파일을 Jupyter로 업로드하는 방안에 대해서 소개합니다.

 

CSV파일에 대하여.

간략히, CSV = comma separated variable 파일을 의미합니다.

- 개별 로우(row)는 하나의 레코드(record)를 의미

- 특수문자인 ","(콤마) 값으로 컬럼을 분리(separate)해 식별

- 첫 로우는 주로 컬럼 이름으로 사용

 

CSV 파일을 Jupyter notebook으로 업로드하는 방법

우리의 CSV 파일은 코드 리포지토리를 clone 한 경로의 

c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks/airport.csv

파일입니다. 

 

이 파일을 우리가 지금 사용 중인, Jupyter 노트북으로 업로드를 진행할 거에요.

만약 vscode를 이용 중이라면, 탐색기에서 컨트롤+c 하시고, 왼쪽 트리뷰에서 디렉토리 생성 후 붙여 넣기 하시면 됩니다.

 

하지만, 웹 기반 Jupyter라면, 아래 절차를 통해 진행해야 합니다.

 

Jupyter notebook에서, CSV 파일을 업로드할 디렉토리 생성

jupyter_csv_upload.png

이렇게 디렉토리를 생성할 경로로 이동하고, (이번 06번 강좌 디렉토리도 좋습니다.) 우측 상단의 "new" 버튼을 누르고 "folder"를 새 폴더를 생성합니다.

 

jupyter_rename_directory.png

만들어진 디렉토리 이름은 "untitled Folder"가 기본입니다. (네, 친절하지 않아요) - 체크 후, "Rename"을 눌러 "Data"로 이름을 변경합니다.

 

jupyter_upload_csv_file.png

네, 업로드할 디렉토리도 준비가 되었습니다. Data 폴더로 이동하고, upload 버튼을 클릭해 CSV 파일을 업로드합니다.

이렇게 Jupyter에서 CSV 파일이나 필요한 파일을 업로드할 수 있습니다. 만들어진 디렉토리와 파일은 당연히, bash 쉘에서도 같은 디렉토리에 파일로 존재합니다.

 

그럼 다음 강좌, pandas에서 CSV 파일 처리에서 뵙겠습니다. 수고하셨습니다.

 

 

파이썬 강좌 책 구매

강좌가 도움이 되셨다면, 책으로 구매 가능합니다. 책 판매 수익금은 전액 코딩 교육 사회공헌 활동에 기부되며, 아래 링크에서 구매하시면 더 많은 금액이 기부됩니다. 

 

책구매 링크: 챗GPT와 함께하는 파이썬 & 머신러닝 코딩 마스터 

파이썬-책구매링크.png

 

참고자료

개발자 커뮤니티 SQLER.com - Python 무료 강좌 - 기초, 중급, 머신러닝

c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks at master · CloudBreadPaPa/c9-python-getting-started (github.com)

No. Subject Author Date Views
Notice SQL강좌: 챗GPT와 함께 배우는 SQL Server 무료 강좌 목차와 소개 (2023년 9월 업데이트) 코난(김대우) 2023.08.18 23442
Notice Python 무료 강좌 - 기초, 중급, 머신러닝(2023년 6월 업데이트) 코난(김대우) 2021.01.01 12418
34 Azure Databricks - MLflow를 이용한 머신러닝(5) - Model 배포 file 코난(김대우) 2021.10.14 501
33 Azure Databricks - MLflow를 이용한 머신러닝(4) - Model Registry file 코난(김대우) 2021.10.12 336
32 Azure Databricks - MLflow를 이용한 머신러닝(3) - Project file 코난(김대우) 2021.10.08 317
31 Azure Databricks - MLflow를 이용한 머신러닝(2) - Tracking file 코난(김대우) 2021.10.08 304
30 Azure Databricks - MLflow를 이용한 머신러닝(1) file 코난(김대우) 2021.10.08 418
29 Azure Databricks - Spark에서 머신러닝 분산 처리 file 코난(김대우) 2021.10.07 157
28 PySpark cheat sheet 자료 - RDD, 데이터 처리 file 코난(김대우) 2021.10.01 121
27 PySpark을 이용한 머신러닝 튜토리얼 예제 코난(김대우) 2021.10.01 908
26 Form Recognizer로 문서에서 표 데이터 추출 file 코난(김대우) 2021.01.21 341
25 MLaaS - 12가지의 머신러닝을 먼저 도입한 기업들의 고민 file 코난(김대우) 2021.01.15 733
24 Python 머신러닝 강좌 - 15. Matplotlib으로 데이터 시각화(visualization) file 코난(김대우) 2021.01.09 709
23 Python 머신러닝 강좌 - 14. NumPy와 Pandas 코난(김대우) 2021.01.09 692
22 Python 머신러닝 강좌 - 13. 모델의 정확도 평가(accuracy evaluating) 코난(김대우) 2021.01.09 1684
21 Python 머신러닝 강좌 - 12. 머신러닝 모델 테스트 코난(김대우) 2021.01.09 985
20 Python 머신러닝 강좌 - 11. scikit-learn으로 선형회귀(linear regression) 모델 머신러닝 트레이닝 수행 코난(김대우) 2021.01.08 353
19 Python 머신러닝 강좌 - 10. 머신러닝을 위해 scikit-learn으로 트레이닝 데이터와 테스트 데이터 분할 코난(김대우) 2021.01.08 538
18 Python 머신러닝 강좌 - 9. 중복데이터와 결측값(missing value) 처리 코난(김대우) 2021.01.08 258
17 Python 머신러닝 강좌 - 8. Pandas DataFrame 컬럼(column) 분할(split)과 삭제(remove) 코난(김대우) 2021.01.08 385
16 Python 머신러닝 강좌 - 7. Pandas DataFrame으로 CSV 파일 읽고 쓰기 코난(김대우) 2021.01.08 528
» Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북 file 코난(김대우) 2021.01.08 444





XE Login