data가 적다면 눈으로 확인해도 쉽게 구분할 수 있지만 data의 양이 방대해 진다면 python을 활용해서 쉽게 다룰 수 있다. python에서도 pandas를 활용하면 더 쉽게 data를 정리할 수 있다.
먼저 data의 내림차순 / 오름차순을 정리해 보자. data는 nasdaq 종목을 가지고 시총에 대해서 정리해 보려 한다.
pandas에서 sort_values를 사용하면 된다. pandas는 library이고 sort_values는 해당 library에 있는 function 이라고 생각하면 된다.
code는 아래와 같다.
market_big = df.sort_values(by = ['Market Cap'],ascending = False)
우선 df는 nasdaq data를 google spread sheet에 저장해서 data frame으로 바꾼 것이다. code를 조금 더 살펴보면 by를 통해 어떤 것을 기준으로 정렬을 할 건지 정하는 것이다. 자 아래 google spread sheet를 보면 Market Cap 즉 시총을 기준으로 정리하는 것을 나타낸다.
ascending 같은 경우는 False는 내림차순 True는 오름차순이다.
자 정리하면
by는 어떠한 data를 기준으로 정리할지 , ascending은 오름차순 / 내림차순을 결정하는 것이다.
내가 pandas를 쓰면서 불편했던 점이 있다. 바로 내가 원하는 data에 접근하기가 쉽지 않았다. 즉 무슨말인지 나는 sort_values로 정리한 data의 첫번째가 무엇인지 두번째가 무엇인지 구하고 싶은데 해당 data frame은 익숙치 않으니 내가 마음대로 출력을 하기가 어려웠다.
그래서 tolist()라는 function으로 list로 변환해서 사용할 수 있다.
big_stock_list = market_big.values.tolist()
for i in range(0, 10):
print(i+1, big_stock_list[i][0], big_stock_list[i][5])
위에서 market_big이 sort_values로 내림차순으로 정리한 data frame이다. 위와 같이 출력을 하면 아래와 같은 결과를 얻을 수 있다.
참고로 21년 12월 13일 data이다. APPLE이 시총 1위, ADOBE가 시총 10위이다.
1. System Verilog 는 왜 사용되는가? (feat. Verilog와 다른점) (1) | 2022.04.19 |
---|---|
C에서 음수를 처리하는 방법 (feat. 2의 보수, 2's compliment) (0) | 2022.04.17 |
<Python> : : google.auth.exceptions.refresherror 문제 해결하기 (0) | 2021.12.11 |
<Python> : : 파이참에서 라이브러리 다운로드 받기 (gsread, oauth2client ) (0) | 2021.12.11 |
verilog 이해하기2 (verilog siganl assignment의 종류) (0) | 2021.10.28 |
댓글 영역