728x90
오류
Pandas에서 csv를 읽고 쓸때 발생하는 에러
UnicodeEncodeError: 'ascii' codec can't encode characters ...
print(data.head())라고하면 출력이 안된다.
무슨 문제일까...
작동하지 않는 해결법들
1.
저장할 때 애초에 encoding='utf-8-sig'으로 저장하기. 시도했으나 안됨
df.to_csv('blarblar.csv', encoding='utf-8-sig')
2.
seperator 추가하기
df.to_csv('blarblar.csv', sep='\t', encoding='utf-8-sig')
3.
def reload_csv(path="ready_for_kmeans.csv"):
import csv
import sys
data = [["a", "b", u'\xe9']]
with open(path, "w") as csv_file:
writer = csv.writer(csv_file, quoting=csv.QUOTE_ALL)
writer.writerows(data)
reload_csv()
결론 및 의아한 점.
Jupyter notebook에선 잘 읽힘... terminal 창에서만 오류가 뜬다...
해결을 못했지만 print(df.head())를 하지 말자 그냥.
'Data handling' 카테고리의 다른 글
[numpy] 이미지 채널 축 변경 (0) | 2021.06.29 |
---|---|
대용량 numpy 파일 text로 쓰기 (0) | 2021.04.05 |
json 파일 저장시 에러 (0) | 2021.01.14 |
기타 에러 ImportError: cannot import name 'StringIO' (0) | 2020.10.28 |
[데이터 전처리] str to json 어떻게 바꾸지? str 형식의 text를 json으로 변환 (0) | 2020.09.29 |