STUDY/Pandas

[Pandas] pivot_table, crosstab, group by

2022. 11. 4. 11:45

피벗 테이블이란, 데이터를 요약한 통계표라고 볼 수 있으며, 기존 데이터를 활용해서 새로운 테이블을 만든 것을 말한다.

같은 목적의 기능이지만 쓰는 형태는 달라 쓰다보면 헷갈리는 판다스 문법 3가지를 한 번에 비교해보려고 한다. 


1. 크로스탭 crosstab

주로 두 개의 변수의 빈도수 구할때 사용하기 쉽다.

pd.crosstab(컬럼명1, 컬럼명2)

# 두 개의 변수의데이터 빈도수 구하기
df_p = pd.crosstab(df["제주 중분류"], df["월"])
df_p.iloc[:5][:5]

 

2. 피벗테이블 pivot_table

pd.pivot_table(data=df, index=컬럼1, <columns=컬럼2>, values=컬럼3)

columns는 스킵 가능

df.pivot_table(index=["alive","class"], values="fare")

 

group by 와 문법 비교해보기

# origin 별로 그룹화 하고 mpg 의 평균 구하기 
# df.groupby("origin")[["mpg"]].mean()

pd.pivot_table(data=df, index="origin", values = "mpg")

 

# df.groupby(by=["origin","cylinders"])[["mpg"]].mean().unstack()

pd.pivot_table(data=df, index="origin", columns = "cylinders", values = "mpg")

그래프로 보면 이런 모양

 

3. 그룹바이 group by *자주 사용*

df.groupby('기준컬럼명')['가져올 컬럼명'].연산()

# df.groupby('class')["fare"].count() 조건은 df[]안에!
df[df["fare"] > 50].groupby('class')["fare"].count()

df.groupby(by="deck")["deck"].count().sort_values

# 업종명으로 그룹화해서 카드이용금액이 상위 5개인 결과 가져오기
df.groupby(by="업종명")["카드이용금액"].sum().sort_values(ascending=False).iloc[:5]

 

그룹바이로 count, mean, sum 한 번에 구하기 (.agg 사용)

#.agg
df.groupby("deck")["fare"].agg(['count','mean','sum'])

df.groupby(["class","who"]).agg({"age":"mean","fare":"mean","deck":"count"})

 

  • 1. 크로스탭 crosstab
  •  
  • 2. 피벗테이블 pivot_table
  •  
  • 3. 그룹바이 group by *자주 사용*
'STUDY/Pandas' 카테고리의 다른 글
  • [pandas] 비즈니스 데이터 분석 실습 (1)
  • [Pandas] 수치 변수 그룹 나누기
  • [Pandas] 판다스 치트 시트, 공식 문서
  • 주피터 노트북 단축키/ 익스텐션(Nbextensions) 설치 방법
둥둥런
둥둥런
대학원생의 UX, 데이터분석, 개발 공부 기록장📁
둥둥런
Done is better than Perfect
둥둥런
전체
오늘
어제

공지사항

  • About me
  • 분류 전체보기
    • TIL
      • 멋사_AI스쿨_TIL
    • 회고
      • 프로젝트 회고
    • STUDY
      • SQL
      • Python
      • Pandas
      • 태블로
      • 통계
      • 머신러닝 | 딥러닝
      • ETC
      • 그로스마케팅 | 광고
      • UX
    • BOOK
    • EVENT

인기 글

블로그 메뉴

  • 태그
  • 관리
hELLO · Designed By 정상우.
둥둥런
[Pandas] pivot_table, crosstab, group by
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.