프로그래밍

Python txt, csv, excel 파일 읽기 총 정리 !!!

스터디올 2022. 7. 28. 22:20
반응형

파이썬 코딩을 하다보면 항상 파일을 읽어와 data 가공을 해야 되는데 항상 그 방법이 헷갈려 계속 찾아본다. 그래서 오늘은 해당 방법을 정리하고 공부하는 차원에서 파일 읽는 것을 총 정리 해보려 한다. 

 

1. with open 구문으로 close 없이 파일 읽기 

with open("input.txt") as file:
	for line in file:
    	print(line)

위와 같이 사용하면 txt file을 한줄씩 읽는다. 이 방법은 csv file도 마찬가지로 한줄씩 읽는다.

 

2. csv, excel DataFrame 형식으로 읽어 들이기 

내가 이전에 쓴 글을 본다면 DataFrame 형식이 다만 복잡해 보이기 위해 쓰는 것이 아니라 대용량의 data를 가공하는데 매우 효율적이라는 사실을 알 것이다. 아래와 같이 읽으면 DataFrame 형식으로 Excel 또는 Csv 형식의 파일을 읽을 수 있다. 

Nasdaq_1 = pd.read_csv("./nasdaq.csv")
Nasdaq_2 = pd.read_excel("./nasdaq.xlsx")

Nasdaq_1 , Nasdaq_2 모두 DataFrame 형식으로 읽힌다. 

 

3. import csv 를 통해 csv 파일 읽기 

csv파일을 line 단위로 읽어서 주로 (, comma) 로 구분되어 있는 것을 split 해주면 되지만 import csv 를 이용해 한번에 읽어 들일 수 있다. 하지만 해당 방법을 그리 추천하진 않는다. 

import csv

with open("nasdaq.csv") as file:
	reader = csv.reader(file, delimiter=',')
	for row in reader:
    	print(row)

지금 배운 지식으로는 이런 것도 있다고 참고만 하자. 

 

4. import openpyxl 

해당 library로 excel을 읽을 수 있다. 해당 방법은 검색을 통해서 하시길 추후 정리하겠다. 이유는 data를 분석하는데 있어서 dataframe을 적극 활용하기 위해서 이다. 또한 너무 detail하게 간다면 더 중요한 것을 할 시간이 없기 때문이다. 

반응형