<Python> : : pandas 활용 내림차순 / 오름차순 , pandas list 전환하기

프로그래밍

by 스터디올 2021. 12. 17. 21:09

pandas 활용해서 data를 다양하게 처리하는 방법을 알아보자.

data가 적다면 눈으로 확인해도 쉽게 구분할 수 있지만 data의 양이 방대해 진다면 python을 활용해서 쉽게 다룰 수 있다. python에서도 pandas를 활용하면 더 쉽게 data를 정리할 수 있다.

먼저 data의 내림차순 / 오름차순을 정리해 보자. data는 nasdaq 종목을 가지고 시총에 대해서 정리해 보려 한다.

pandas에서 sort_values를 사용하면 된다. pandas는 library이고 sort_values는 해당 library에 있는 function 이라고 생각하면 된다.

code는 아래와 같다.

market_big = df.sort_values(by = ['Market Cap'],ascending = False)

우선 df는 nasdaq data를 google spread sheet에 저장해서 data frame으로 바꾼 것이다. code를 조금 더 살펴보면 by를 통해 어떤 것을 기준으로 정렬을 할 건지 정하는 것이다. 자 아래 google spread sheet를 보면 Market Cap 즉 시총을 기준으로 정리하는 것을 나타낸다.

ascending 같은 경우는 False는 내림차순 True는 오름차순이다.

자 정리하면

by는 어떠한 data를 기준으로 정리할지 , ascending은 오름차순 / 내림차순을 결정하는 것이다.

내가 pandas를 쓰면서 불편했던 점이 있다. 바로 내가 원하는 data에 접근하기가 쉽지 않았다. 즉 무슨말인지 나는 sort_values로 정리한 data의 첫번째가 무엇인지 두번째가 무엇인지 구하고 싶은데 해당 data frame은 익숙치 않으니 내가 마음대로 출력을 하기가 어려웠다.

그래서 tolist()라는 function으로 list로 변환해서 사용할 수 있다.

big_stock_list = market_big.values.tolist()
for i in range(0, 10):
    print(i+1, big_stock_list[i][0], big_stock_list[i][5])

위에서 market_big이 sort_values로 내림차순으로 정리한 data frame이다. 위와 같이 출력을 하면 아래와 같은 결과를 얻을 수 있다.

참고로 21년 12월 13일 data이다. APPLE이 시총 1위, ADOBE가 시총 10위이다.

저작자표시

'프로그래밍' 카테고리의 다른 글

1. System Verilog 는 왜 사용되는가? (feat. Verilog와 다른점) (1)	2022.04.19
C에서 음수를 처리하는 방법 (feat. 2의 보수, 2's compliment) (0)	2022.04.17
<Python> : : google.auth.exceptions.refresherror 문제 해결하기 (0)	2021.12.11
<Python> : : 파이참에서 라이브러리 다운로드 받기 (gsread, oauth2client ) (0)	2021.12.11
verilog 이해하기2 (verilog siganl assignment의 종류) (0)	2021.10.28

Study All

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

상세 컨텐츠

본문 제목

본문

pandas 활용해서 data를 다양하게 처리하는 방법을 알아보자.

'프로그래밍' 카테고리의 다른 글

관련글 더보기

댓글 영역

추가 정보

인기글

최신글

티스토리툴바