STUDY/Pandas

[Pandas] 수치 변수 그룹 나누기

2022. 11. 9. 14:09

이산화

pd.cut() VS pd.qcut()

bins == 그룹 개수

q == quantile

 

# SalePrice - cut, qcut
train["SalePrice_cut"] = pd.cut(train["SalePrice"], bins=4, labels=[1,2,3,4])
# q == quantile
train["SalePrice_qcut"] = pd.qcut(train["SalePrice"], q=4, labels=[1,2,3,4])

 

차이 알아보기

# "SalePrice_cut", "SalePrice_qcut" - value_counts
display(train["SalePrice_cut"].value_counts())
display(train["SalePrice_qcut"].value_counts().sort_index())

# "SalePrice_cut", "SalePrice_qcut" - countplot
fig, axes = plt.subplots(nrows=1, ncols=2, figsize=(12, 4))
sns.countplot(data=train, x="SalePrice_cut", ax=axes[0])
sns.countplot(data=train, x="SalePrice_qcut", ax=axes[1])

 

'STUDY/Pandas' 카테고리의 다른 글
  • [pandas] 비즈니스 데이터 분석 실습 (2)
  • [pandas] 비즈니스 데이터 분석 실습 (1)
  • [Pandas] pivot_table, crosstab, group by
  • [Pandas] 판다스 치트 시트, 공식 문서
둥둥런
둥둥런
대학원생의 UX, 데이터분석, 개발 공부 기록장📁
둥둥런
Done is better than Perfect
둥둥런
전체
오늘
어제

공지사항

  • About me
  • 분류 전체보기
    • TIL
      • 멋사_AI스쿨_TIL
    • 회고
      • 프로젝트 회고
    • STUDY
      • SQL
      • Python
      • Pandas
      • 태블로
      • 통계
      • 머신러닝 | 딥러닝
      • ETC
      • 그로스마케팅 | 광고
      • UX
    • BOOK
    • EVENT

인기 글

블로그 메뉴

  • 태그
  • 관리
hELLO · Designed By 정상우.
둥둥런
[Pandas] 수치 변수 그룹 나누기
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.