STUDY/통계

[통계] 회귀분석

2023. 2. 20. 10:56

지도학습

독립변수 x를 이용해서 종속변수 y를 예측하는 것

 

  • 독립변수 (x): 예측에 바탕이 되는 정보, 인과관계의 원인, 입력값
  • 종속변수 (y): 예측의 대상, 인과관계의 결과, 출력값

지도학습의 구분

  • 회귀분석 Regression
  • 분류분석 Classification

선형 모형

회귀 방정식

𝑦̂  = 𝑤𝑥 + 𝑏

  • 𝑦̂: y값의 예측치
  • 𝑥: 독립변수
  • 𝑤: 기울기 또는 가중치
  • 𝑏: y절편 x=0일때. y의 예측치

선형회귀분석의 기초_데이터 사이언스 스쿨

 

4.2 선형회귀분석의 기초 — 데이터 사이언스 스쿨

.ipynb .pdf to have style consistency -->

datascienceschool.net

잔차 residual

  • 𝑦̂와 y의 차이 (실제값과 예측값의 차이)
  • 잔차를 그대로 더하면 부호로 인해 값이 작아지므로, 제곱합의 평균을 계산하게 됨 -> 잔차분산
  • 잔차 분산이 작을 수록 예측이 잘 맞는다.

최소제곱법 Ordinary Least Squares

최소제곱법: 잔차분산이 최소가 되게 하는 w,b 등 계수를 추정

 

결정계수(R2)

이미지출처_https://www.scribbr.com/statistics/coefficient-of-determination/

결정계수는 회귀분석의 정밀도를 나타냅니다.

파이썬 회귀분석

# 가져오기
from statsmodels.formula.api import ols

# 분석
m = ols("price ~ mileage", data=df).fit()

# 결과
m.summary()

#범주가 2개인 경우
ols('price ~ model', df).fit().summary()

다중회귀분석

  • 독립변수 2개 이상인 회귀분석
  • 기호 +로 변수를 구분해서 표시
m = ols("rating ~ marriage + overtime", data = hr).fit()
m.summary()


출처

멋쟁이사자처럼 AI스쿨 7기 유재명강사님 특강 자료

누워서 읽는 통계학 (한빛아카데미)

  • 지도학습
  • 선형 모형
  • 잔차 residual
  • 파이썬 회귀분석
'STUDY/통계' 카테고리의 다른 글
  • [통계] 상관분석 | 피어슨 상관 계수
  • [통계] 통계적 가설 검정 | 방법과 코드
  • 221007 AI스쿨 TIL (17일차) 데이터 분석을 위한 통계 기초
둥둥런
둥둥런
대학원생의 UX, 데이터분석, 개발 공부 기록장📁
둥둥런
Done is better than Perfect
둥둥런
전체
오늘
어제

공지사항

  • About me
  • 분류 전체보기
    • TIL
      • 멋사_AI스쿨_TIL
    • 회고
      • 프로젝트 회고
    • STUDY
      • SQL
      • Python
      • Pandas
      • 태블로
      • 통계
      • 머신러닝 | 딥러닝
      • ETC
      • 그로스마케팅 | 광고
      • UX
    • BOOK
    • EVENT

인기 글

블로그 메뉴

  • 태그
  • 관리
hELLO · Designed By 정상우.
둥둥런
[통계] 회귀분석
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.