Python txt, csv, excel 파일 읽기 총 정리 !!!
파이썬 코딩을 하다보면 항상 파일을 읽어와 data 가공을 해야 되는데 항상 그 방법이 헷갈려 계속 찾아본다. 그래서 오늘은 해당 방법을 정리하고 공부하는 차원에서 파일 읽는 것을 총 정리 해보려 한다.
1. with open 구문으로 close 없이 파일 읽기
with open("input.txt") as file:
for line in file:
print(line)
위와 같이 사용하면 txt file을 한줄씩 읽는다. 이 방법은 csv file도 마찬가지로 한줄씩 읽는다.
2. csv, excel DataFrame 형식으로 읽어 들이기
내가 이전에 쓴 글을 본다면 DataFrame 형식이 다만 복잡해 보이기 위해 쓰는 것이 아니라 대용량의 data를 가공하는데 매우 효율적이라는 사실을 알 것이다. 아래와 같이 읽으면 DataFrame 형식으로 Excel 또는 Csv 형식의 파일을 읽을 수 있다.
Nasdaq_1 = pd.read_csv("./nasdaq.csv")
Nasdaq_2 = pd.read_excel("./nasdaq.xlsx")
Nasdaq_1 , Nasdaq_2 모두 DataFrame 형식으로 읽힌다.
3. import csv 를 통해 csv 파일 읽기
csv파일을 line 단위로 읽어서 주로 (, comma) 로 구분되어 있는 것을 split 해주면 되지만 import csv 를 이용해 한번에 읽어 들일 수 있다. 하지만 해당 방법을 그리 추천하진 않는다.
import csv
with open("nasdaq.csv") as file:
reader = csv.reader(file, delimiter=',')
for row in reader:
print(row)
지금 배운 지식으로는 이런 것도 있다고 참고만 하자.
4. import openpyxl
해당 library로 excel을 읽을 수 있다. 해당 방법은 검색을 통해서 하시길 추후 정리하겠다. 이유는 data를 분석하는데 있어서 dataframe을 적극 활용하기 위해서 이다. 또한 너무 detail하게 간다면 더 중요한 것을 할 시간이 없기 때문이다.