2023년 6월 업데이트
안녕하세요. SQLER의 코난 김대우입니다.
이번 강좌에서는, Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북을 진행토록 하겠습니다.
SQLER에서 진행되는 전체 Python / 머신러닝 강좌 목록
코드를 실행하기 위해서는, vscode에서 새로운 파일을 만들고 강좌 내용을 단계별로 copy&paste 해서 실행하시면 됩니다. 또는, Jupyter notebook을 실행하고 단계별로 실행하셔도 됩니다.
상세한 환경 구성이 필요하시다면, 개발자 커뮤니티 SQLER.com - Python 초급 강좌 목차 - 1. Python 개발 환경 구성 문서를 참조해 WSL, vscode, conda, jupyter notebook 설정을 모두 먼저 완료하시길 권장해 드립니다.
TL;DR
CSV(쉼표로 구분된 값) 파일은 일반적으로 데이터 저장에 사용되며, 각 행은 레코드를 나타내고 열은 쉼표로 구분합니다. CSV 파일을 Jupyter Notebook에 업로드하려면 원하는 위치에 디렉토리를 생성하고 "업로드" 버튼을 사용하여 파일을 선택하여 업로드합니다.
Python 머신러닝 강좌 - 6. CSV 파일과 주피터 노트북
데이터파일을 로드하는 경우가 많습니다. 일반적인 경우 CSV가 가장 많이 사용되는 파일 포맷이고, 이 CSV 파일을 Jupyter로 업로드하는 방안에 대해서 소개합니다.
CSV파일에 대하여.
간략히, CSV = comma separated variable 파일을 의미합니다.
- 개별 로우(row)는 하나의 레코드(record)를 의미
- 특수문자인 ","(콤마) 값으로 컬럼을 분리(separate)해 식별
- 첫 로우는 주로 컬럼 이름으로 사용
CSV 파일을 Jupyter notebook으로 업로드하는 방법
우리의 CSV 파일은 코드 리포지토리를 clone 한 경로의
c9-python-getting-started/even-more-python-for-beginners-data-tools/06 - CSV Files and Jupyter Notebooks/airport.csv
파일입니다.
이 파일을 우리가 지금 사용 중인, Jupyter 노트북으로 업로드를 진행할 거에요.
만약 vscode를 이용 중이라면, 탐색기에서 컨트롤+c 하시고, 왼쪽 트리뷰에서 디렉토리 생성 후 붙여 넣기 하시면 됩니다.
하지만, 웹 기반 Jupyter라면, 아래 절차를 통해 진행해야 합니다.
Jupyter notebook에서, CSV 파일을 업로드할 디렉토리 생성
이렇게 디렉토리를 생성할 경로로 이동하고, (이번 06번 강좌 디렉토리도 좋습니다.) 우측 상단의 "new" 버튼을 누르고 "folder"를 새 폴더를 생성합니다.
만들어진 디렉토리 이름은 "untitled Folder"가 기본입니다. (네, 친절하지 않아요) - 체크 후, "Rename"을 눌러 "Data"로 이름을 변경합니다.
네, 업로드할 디렉토리도 준비가 되었습니다. Data 폴더로 이동하고, upload 버튼을 클릭해 CSV 파일을 업로드합니다.
이렇게 Jupyter에서 CSV 파일이나 필요한 파일을 업로드할 수 있습니다. 만들어진 디렉토리와 파일은 당연히, bash 쉘에서도 같은 디렉토리에 파일로 존재합니다.
그럼 다음 강좌, pandas에서 CSV 파일 처리에서 뵙겠습니다. 수고하셨습니다.
파이썬 강좌 책 구매
강좌가 도움이 되셨다면, 책으로 구매 가능합니다. 책 판매 수익금은 전액 코딩 교육 사회공헌 활동에 기부되며, 아래 링크에서 구매하시면 더 많은 금액이 기부됩니다.
책구매 링크: 챗GPT와 함께하는 파이썬 & 머신러닝 코딩 마스터