[파이썬] Python 판다스(pandas)로 엑셀(xls, xlsx, csv)파일로 저장 방법

[파이썬] Python 판다스(pandas)로 엑셀(xls, xlsx, csv)파일로 저장 방법

판다스(pandas) 라이브러리는 데이터 분석을 위해 많이 사용되는 모듈입니다.

우리는 오늘 데이터 분석이 아닌 엑셀파일로 데이터를 저장하는 방법에 대해 알아봅니다.

xlsx, csv파일을 읽어 온 후 DataFrame으로 데이터를 처리할 수 있습니다.

혹은 웹 크롤링을 하여 가져올 수 있는데요. 판다스(pandas)를 사용하여 엑셀파일로 데이터를 저장하려면 openpyxl 라이브러리와 numpy모듈이 필요합니다. 

엑셀로 저장하는 예제 스크립트

to_excel()함수를 사용합니다. 

import pandas
import openpyxl
pandas.__version__
df = pandas.DataFrame(data_lst, columns=['뉴스제목', "기사 날짜", "URL", "이미지 URL"])
# writer = pandas.ExcelWriter("뉴스타파_기사.xlsx", engine="openpyxl")
#df.to_excel("뉴스.xlsx", index=False, sheet_name="첫번째탭")

with pandas.ExcelWriter("./뉴스.xlsx") as writer:
    df.to_excel(writer, sheet_name="TEST1")

openpyxl 모듈을 사용할 수 없는 경우 오류가 발생함으로 설치를 먼저 하고 진행하세요.

16
Traceback (most recent call last):
  File "C:\python\Workspace\main.py", line 59, in <module>
    with pandas.ExcelWriter("./뉴스.xlsx") as writer:
  File "C:\Users\ilike\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\io\excel\_openpyxl.py", line 18, in __init__
    from openpyxl.workbook import Workbook
ModuleNotFoundError: No module named 'openpyxl'

Process finished with exit code 1

개발툴(IDE)로 파이참을 사용하고 있는데 설치가 되지않은 모듈을 import 하게되면 빨간줄로 표시해줍니다.

마우스 커서를 위로 올리면 바로 설치할 수 있어요. (단축키 : Alt + Shift + Enter)

openpyxl 모듈을 설치 후 스크립트를 실행하면 엑셀파일로 저장되고 파일을 열어보면 다음과 같은 결과를 얻을 수 있어요.

csv로 저장하기위해 to_csv()함수를 사용합니다.

만약 csv파일을 열었을 때 한글이 깨지는 경우 encoding을 utf-8-sig로 해주세요. 

csv파일로 저장하는 경우에는 openpyxl 라이브러리를 import 할 필요 없습니다. 

import pandas

df = pandas.DataFrame(data_lst, columns=['뉴스제목', "기사 날짜", "URL", "이미지 URL"])
df.to_csv("test2.csv", index=False, encoding="utf-8-sig")  #utf-8  , ms949

data_lst 변수의 값이 필요하신경우 아래 링크를 참고하세요.

오늘은 여기까지!!!


카테고리의 다른 글
error: Content is protected !!