[파이썬] Python 판다스(pandas)로 엑셀(xls, xlsx, csv)파일로 저장 방법
판다스(pandas) 라이브러리는 데이터 분석을 위해 많이 사용되는 모듈입니다.
우리는 오늘 데이터 분석이 아닌 엑셀파일로 데이터를 저장하는 방법에 대해 알아봅니다.
xlsx, csv파일을 읽어 온 후 DataFrame으로 데이터를 처리할 수 있습니다.
혹은 웹 크롤링을 하여 가져올 수 있는데요. 판다스(pandas)를 사용하여 엑셀파일로 데이터를 저장하려면 openpyxl 라이브러리와 numpy모듈이 필요합니다.
엑셀로 저장하는 예제 스크립트
to_excel()함수를 사용합니다.
import pandas import openpyxl pandas.__version__ df = pandas.DataFrame(data_lst, columns=['뉴스제목', "기사 날짜", "URL", "이미지 URL"]) # writer = pandas.ExcelWriter("뉴스타파_기사.xlsx", engine="openpyxl") #df.to_excel("뉴스.xlsx", index=False, sheet_name="첫번째탭") with pandas.ExcelWriter("./뉴스.xlsx") as writer: df.to_excel(writer, sheet_name="TEST1")
openpyxl 모듈을 사용할 수 없는 경우 오류가 발생함으로 설치를 먼저 하고 진행하세요.
16 Traceback (most recent call last): File "C:\python\Workspace\main.py", line 59, in <module> with pandas.ExcelWriter("./뉴스.xlsx") as writer: File "C:\Users\ilike\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\io\excel\_openpyxl.py", line 18, in __init__ from openpyxl.workbook import Workbook ModuleNotFoundError: No module named 'openpyxl' Process finished with exit code 1
개발툴(IDE)로 파이참을 사용하고 있는데 설치가 되지않은 모듈을 import 하게되면 빨간줄로 표시해줍니다.
마우스 커서를 위로 올리면 바로 설치할 수 있어요. (단축키 : Alt + Shift + Enter)
openpyxl 모듈을 설치 후 스크립트를 실행하면 엑셀파일로 저장되고 파일을 열어보면 다음과 같은 결과를 얻을 수 있어요.
csv로 저장하기위해 to_csv()함수를 사용합니다.
만약 csv파일을 열었을 때 한글이 깨지는 경우 encoding을 utf-8-sig로 해주세요.
csv파일로 저장하는 경우에는 openpyxl 라이브러리를 import 할 필요 없습니다.
import pandas df = pandas.DataFrame(data_lst, columns=['뉴스제목', "기사 날짜", "URL", "이미지 URL"]) df.to_csv("test2.csv", index=False, encoding="utf-8-sig") #utf-8 , ms949
data_lst 변수의 값이 필요하신경우 아래 링크를 참고하세요.
오늘은 여기까지!!!