머신러닝 & AI 개발자 Tip & 강좌 게시판

Data Scientist와 개발자를 위한 머신러닝, AI 등 개발 Tip과 강좌 게시판 입니다. 일반적인 머신러닝은 물론 딥러닝(Tensorflow, Keras, PyTorch 등), 인공지능 관련 업무를 진행하면서 얻은 Tip이나 강좌, 새로운 소식을 적어 주시면 다른 개발자 분들에게 큰 도움이 됩니다.

안녕하세요. SQLER의 코난 김대우입니다. 

이번 강좌에서는, Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북을 진행토록 하겠습니다.

 

SQLER에서 진행되는 전체 Python / 머신러닝 강좌 목록

 

코드를 실행하기 위해서는, vscode에서 새로운 파일을 만들고 강좌 내용을 단계별로 copy&paste해서 실행하시면 됩니다. 또는, Jupyter notebook을 실행하고 단계별로 실행하셔도 됩니다.

 

상세한 환경 구성이 필요 하시다면, 개발자 커뮤니티 SQLER.com - Python 초급 강좌 목차 - 1. Python 개발 환경 구성 문서를 참조해 WSL, vscode, conda, jupyter notebook 설정을 모두 먼저 완료 하시길 권장해 드립니다.

 

 

Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북

 

데이터파일을 로드하는 경우가 많다. 일반적인 경우 CSV가 가장 많이 사용되는 파일 포맷입이고, 이 CSV 파일을 Jupyter로 업로드하는 방안에 대해서 소개합니다.

 

CSV파일에 대하여.

간략히, CSV = comma separated variable 파일을 의미합니다.

- 개별 로우(row)는 하나의 레코드(record)를 의미

- 특수문자인 ","(콤마) 값으로 컬럼을 분리(separate)해 식별

- 첫 로우는 주로 컬럼 이름으로 사용

 

CSV 파일을 Jupyter notebook으로 업로드 하는 방법

우리의 CSV 파일은 코드 리포지토리를 clone한 경로의 

c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks/airport.csv

파일입니다. 

 

이 파일을 우리가 지금 사용 중인, Jupyter 노트북으로 업로드를 진행할거에요.

만약 vscode를 이용 중이라면, 탐색기에서 컨트롤+c 하시고, 왼쪽 트리뷰에서 디렉토리 생성 후 붙여넣기 하시면 됩니다.

 

하지만, 웹 기반 Jupyter라면, 아래 절차를 통해 진행해야 합니다.

 

Jupyter notebook에서, CSV 파일을 업로드할 디렉토리 생성

jupyter_csv_upload.png

이렇게 디렉토리를 생성할 경로로 이동하고, (이번 06번 강좌 디렉토리도 좋습니다.) 우측 상단의 "new" 버튼을 누르고 "folder"를 새 폴더를 생성합니다.

 

jupyter_rename_directory.png

만들어진 디렉토리 이름은 "untitled Folder"가 기본입니다. (네, 친절하지 않아요) - 체크 후, "Rename"을 눌러 "Data"로 이름을 변경합니다.

 

jupyter_upload_csv_file.png

네, 업로드할 디렉토리도 준비가 되었습니다. Data 폴더로 이동 하고, upload 버튼을 클릭해 CSV 파일을 업로드합니다.

이렇게 Jupyter에서 CSV 파일이나 필요한 파일을 업로드 할 수 있습니다. 만들어진 디렉토리와 파일은 당연히, bash 쉘에서도 같은 디렉토리에 파일로 존재합니다.

 

그럼 다음 강좌, pandas에서 CSV 파일 처리에서 뵙겠습니다. 수고하셨습니다.

 

참고자료

개발자 커뮤니티 SQLER.com - Python 무료 강좌 - 기초, 중급, 머신러닝

c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks at master · CloudBreadPaPa/c9-python-getting-started (github.com)

No. Subject Author Date Views
26 Form Recognizer로 문서에서 표 데이터 추출 file 코난(김대우) 2021.01.21 145
25 MLaaS - (1) 12가지의 머신러닝을 먼저 도입한 기업들의 고민 file 코난(김대우) 2021.01.15 288
24 Python 머신러닝 강좌 - 15. Matplotlib으로 데이터 시각화(visualization) file 코난(김대우) 2021.01.09 144
23 Python 머신러닝 강좌 - 14. NumPy와 Pandas 코난(김대우) 2021.01.09 126
22 Python 머신러닝 강좌 - 13. 모델의 정확도 평가(accuracy evaluating) 코난(김대우) 2021.01.09 93
21 Python 머신러닝 강좌 - 12. 머신러닝 모델 테스트 코난(김대우) 2021.01.09 78
20 Python 머신러닝 강좌 - 11. scikit-learn으로 선형회기(linear regression) 모델 머신러닝 트레이닝 수행 코난(김대우) 2021.01.08 90
19 Python 머신러닝 강좌 - 10. 머신러닝을 위해 scikit-learn으로 트레이닝 데이터와 테스트 데이터 분할 코난(김대우) 2021.01.08 47
18 Python 머신러닝 강좌 - 9. 중복데이터와 결측값(missing value) 처리 코난(김대우) 2021.01.08 36
17 Python 머신러닝 강좌 - 8. Pandas DataFrame 컬럼(column) 분할(split)과 삭제(remove) 코난(김대우) 2021.01.08 46
16 Python 머신러닝 강좌 - 7. Pandas DataFrame으로 CSV 파일 읽고 쓰기 코난(김대우) 2021.01.08 24
» Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북 file 코난(김대우) 2021.01.08 38
14 Python 머신러닝 강좌 - 5. Pandas DataFrame에 질의(Query) 코난(김대우) 2021.01.07 36
13 Python 머신러닝 강좌 - 4. Pandas DataFrame file 코난(김대우) 2021.01.07 31
12 Python 머신러닝 강좌 - 3. Pandas 소개 file 코난(김대우) 2021.01.07 61
11 Python 머신러닝 강좌 - 2. Anaconda와 Conda 구성 file 코난(김대우) 2021.01.06 69
10 Jupyter notebook 단축키 등의 cheat sheet file 코난(김대우) 2021.01.06 60
9 Python 머신러닝 강좌 - 1. 주피터 노트북(Jupyter Notebook) 구성 file 코난(김대우) 2021.01.06 204
8 2021년 머신러닝과 인공지능(AI) 트렌드 - MLaaS (서비스로의 머신러닝) file 코난(김대우) 2020.12.29 188
7 머신러닝을 시작하는 개발자를 위한 - (4) 2021년의 ML Trend - MLaaS와 MLOps(Machine Learning + DevOps) 코난(김대우) 2020.12.28 154





XE Login