프로그래밍

<Python> : : pandas 활용 내림차순 / 오름차순 , pandas list 전환하기

스터디올 2021. 12. 17. 21:09
반응형

pandas 활용해서 data를 다양하게 처리하는 방법을 알아보자. 

data가 적다면 눈으로 확인해도 쉽게 구분할 수 있지만 data의 양이 방대해 진다면 python을 활용해서 쉽게 다룰 수 있다. python에서도 pandas를 활용하면 더 쉽게 data를 정리할 수 있다. 

 

먼저 data의 내림차순 / 오름차순을 정리해 보자. data는 nasdaq 종목을 가지고 시총에 대해서 정리해 보려 한다. 

pandas에서 sort_values를 사용하면 된다. pandas는 library이고 sort_values는 해당 library에 있는 function 이라고 생각하면 된다. 

 

code는 아래와 같다. 

market_big = df.sort_values(by = ['Market Cap'],ascending = False)

 

우선 df는 nasdaq data를 google spread sheet에 저장해서 data frame으로 바꾼 것이다. code를 조금 더 살펴보면 by를 통해 어떤 것을 기준으로 정렬을 할 건지 정하는 것이다. 자 아래 google spread sheet를 보면 Market Cap 즉 시총을 기준으로 정리하는 것을 나타낸다. 

ascending 같은 경우는 False는 내림차순 True는 오름차순이다. 

자 정리하면

by는 어떠한 data를 기준으로 정리할지 , ascending은 오름차순 / 내림차순을 결정하는 것이다. 

 

내가 pandas를 쓰면서 불편했던 점이 있다. 바로 내가 원하는 data에 접근하기가 쉽지 않았다. 즉 무슨말인지 나는 sort_values로 정리한 data의 첫번째가 무엇인지 두번째가 무엇인지 구하고 싶은데 해당 data frame은 익숙치 않으니 내가 마음대로 출력을 하기가 어려웠다. 

 

그래서 tolist()라는 function으로 list로 변환해서 사용할 수 있다. 

big_stock_list = market_big.values.tolist()
for i in range(0, 10):
    print(i+1, big_stock_list[i][0], big_stock_list[i][5])

위에서 market_big이 sort_values로 내림차순으로 정리한 data frame이다. 위와 같이 출력을 하면 아래와 같은 결과를 얻을 수 있다. 

참고로 21년 12월 13일 data이다. APPLE이 시총 1위, ADOBE가 시총 10위이다. 

 

반응형