프로그래밍

<Python> : : pandas DataFrame List 처럼 사용하기

스터디올 2022. 8. 1. 21:26
반응형

2022.07.29 - [프로그래밍] - Python DataFrame format 자유롭게 이용하기(indexing , slicing)

 

Python DataFrame format 자유롭게 이용하기(indexing , slicing)

Python에서 DataFrame이라는 format은 data를 가공하는데 매우 유용하게 사용된다. 다만 그 형식이 list와 비교했을 때 생소한 부분이 있기에 방법에 대해 숙지하고 있어야 될 필요가 있다. 이번 글은 해

jun-study.tistory.com

이전 글을 쓰면서 한번 정리했다고 하나 DataFrame을 계속 사용하다 보니 내가 생각했던 것과 다른 부분이 있어서 다시 한번 정리하려 한다. 

 

우선 DataFrame은 Excel로 부터 가져온다고 하고 엑셀 내용은 아래와 같다. 

1. column을 접근 하는 방법. 

- df.columns 를 사용해 전체 접근 가능

- df["Symbol"] 같이 Series의 이름을 통해 접근 가능. (DataFrame은 여러 Series들을 모아 놓은 것이다.) 위 excel에서 Symbol, Name, Last Sale 등등은 전부 접근 가능한 이름이다. 

 

2. df[0] , df[1] 같이 사용하면 행(row)에 접근 가능하다.

여기서 list와 다르다. 숫자 index를 사용하면 행에 접근가능하다. 이는 DataFrame을 생성할때 따로 index를 설정 안해서 자동으로 0,1,2,3 ... 순으로 indexing을 하기에 그렇다. 그렇기에 index를 다르게 설정을 해준다면 다르게 접근해야 한다. 

 

3. df["Symbol"][0] 으로 일부 데이터 접근 가능

df["Symbol"][0] 는 위에 excel에서 AAPL이라는 data이다. 이처럼 이중 list 처럼 접근이 가능하다. 

 

4. 특정 row / column 제거 

data를 사용하기 위해서는 특정 row / column을 제거해야 되는 경우가 있다. 이는 drop을 통해 해결 한다. 위에 예시에서 Country라는 column을 제거하기 위해서는 아래와 같이 사용하면 된다. 

 

df.drop("Country", axis = 1)

 

row를 제거하기 위해서는 axis = 0 또는  default가 0이기 때문에 생략해 줘도 된다. 그리고 Country 대신에는 지우고 싶은 index를 적어주면 된다. 

반응형