Python Python code page 오류 해결 - UnicodeDecodeError: 'cp949' codec can't decode byte ____ in position
최근 작업하면서 발생한 이슈 빠르게 정리합니다.
예전에 작업된 Python 문서를 읽을때 이렇게
UnicodeDecodeError: 'cp949' codec can't decode byte 0x____ in position
오류가 발생하였습니다. - 아마도 HTML 문서가 CP949로 저장되어서 발생합니다.
Python에서 다음 방법으로, 문서을 열때 옵션을 이용해 처리합니다.
open('filepath', 'rt', encoding='UTF8')
근본적으로는 최초 파일을 저장할때 utf-8로 저장합니다.
Comment 1
-
지영아빠
2022.11.29 10:53
python할 때 당혹스러운 코덱...
맥, linux에서는 저렇게 head명령으로 바로 샘플이용 코덱을 가져오는..
import chardet
os.system('head -n 150 org_filename > sample.tmp')
rawdata = open("sample.tmp", 'rb').read()
res = chardet.detect(rawdata)
with open(filename,'r', encoding=res['encoding']) as f:
....