안녕하세요. SQLER의 코난 김대우입니다.
이번 강좌에서는, Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북을 진행토록 하겠습니다.
SQLER에서 진행되는 전체 Python / 머신러닝 강좌 목록
코드를 실행하기 위해서는, vscode에서 새로운 파일을 만들고 강좌 내용을 단계별로 copy&paste해서 실행하시면 됩니다. 또는, Jupyter notebook을 실행하고 단계별로 실행하셔도 됩니다.
상세한 환경 구성이 필요 하시다면, 개발자 커뮤니티 SQLER.com - Python 초급 강좌 목차 - 1. Python 개발 환경 구성 문서를 참조해 WSL, vscode, conda, jupyter notebook 설정을 모두 먼저 완료 하시길 권장해 드립니다.
Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북
데이터파일을 로드하는 경우가 많다. 일반적인 경우 CSV가 가장 많이 사용되는 파일 포맷입이고, 이 CSV 파일을 Jupyter로 업로드하는 방안에 대해서 소개합니다.
CSV파일에 대하여.
간략히, CSV = comma separated variable 파일을 의미합니다.
- 개별 로우(row)는 하나의 레코드(record)를 의미
- 특수문자인 ","(콤마) 값으로 컬럼을 분리(separate)해 식별
- 첫 로우는 주로 컬럼 이름으로 사용
CSV 파일을 Jupyter notebook으로 업로드 하는 방법
우리의 CSV 파일은 코드 리포지토리를 clone한 경로의
c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks/airport.csv
파일입니다.
이 파일을 우리가 지금 사용 중인, Jupyter 노트북으로 업로드를 진행할거에요.
만약 vscode를 이용 중이라면, 탐색기에서 컨트롤+c 하시고, 왼쪽 트리뷰에서 디렉토리 생성 후 붙여넣기 하시면 됩니다.
하지만, 웹 기반 Jupyter라면, 아래 절차를 통해 진행해야 합니다.
Jupyter notebook에서, CSV 파일을 업로드할 디렉토리 생성
이렇게 디렉토리를 생성할 경로로 이동하고, (이번 06번 강좌 디렉토리도 좋습니다.) 우측 상단의 "new" 버튼을 누르고 "folder"를 새 폴더를 생성합니다.
만들어진 디렉토리 이름은 "untitled Folder"가 기본입니다. (네, 친절하지 않아요) - 체크 후, "Rename"을 눌러 "Data"로 이름을 변경합니다.
네, 업로드할 디렉토리도 준비가 되었습니다. Data 폴더로 이동 하고, upload 버튼을 클릭해 CSV 파일을 업로드합니다.
이렇게 Jupyter에서 CSV 파일이나 필요한 파일을 업로드 할 수 있습니다. 만들어진 디렉토리와 파일은 당연히, bash 쉘에서도 같은 디렉토리에 파일로 존재합니다.
그럼 다음 강좌, pandas에서 CSV 파일 처리에서 뵙겠습니다. 수고하셨습니다.