<Python> : : pandas DataFrame List 처럼 사용하기
2022.07.29 - [프로그래밍] - Python DataFrame format 자유롭게 이용하기(indexing , slicing)
이전 글을 쓰면서 한번 정리했다고 하나 DataFrame을 계속 사용하다 보니 내가 생각했던 것과 다른 부분이 있어서 다시 한번 정리하려 한다.
우선 DataFrame은 Excel로 부터 가져온다고 하고 엑셀 내용은 아래와 같다.
1. column을 접근 하는 방법.
- df.columns 를 사용해 전체 접근 가능
- df["Symbol"] 같이 Series의 이름을 통해 접근 가능. (DataFrame은 여러 Series들을 모아 놓은 것이다.) 위 excel에서 Symbol, Name, Last Sale 등등은 전부 접근 가능한 이름이다.
2. df[0] , df[1] 같이 사용하면 행(row)에 접근 가능하다.
여기서 list와 다르다. 숫자 index를 사용하면 행에 접근가능하다. 이는 DataFrame을 생성할때 따로 index를 설정 안해서 자동으로 0,1,2,3 ... 순으로 indexing을 하기에 그렇다. 그렇기에 index를 다르게 설정을 해준다면 다르게 접근해야 한다.
3. df["Symbol"][0] 으로 일부 데이터 접근 가능
df["Symbol"][0] 는 위에 excel에서 AAPL이라는 data이다. 이처럼 이중 list 처럼 접근이 가능하다.
4. 특정 row / column 제거
data를 사용하기 위해서는 특정 row / column을 제거해야 되는 경우가 있다. 이는 drop을 통해 해결 한다. 위에 예시에서 Country라는 column을 제거하기 위해서는 아래와 같이 사용하면 된다.
df.drop("Country", axis = 1)
row를 제거하기 위해서는 axis = 0 또는 default가 0이기 때문에 생략해 줘도 된다. 그리고 Country 대신에는 지우고 싶은 index를 적어주면 된다.