기초통계

STUDY/통계

[통계] 회귀분석

지도학습 독립변수 x를 이용해서 종속변수 y를 예측하는 것 독립변수 (x): 예측에 바탕이 되는 정보, 인과관계의 원인, 입력값 종속변수 (y): 예측의 대상, 인과관계의 결과, 출력값 지도학습의 구분 회귀분석 Regression 분류분석 Classification 선형 모형 회귀 방정식 𝑦̂ = 𝑤𝑥 + 𝑏 𝑦̂: y값의 예측치 𝑥: 독립변수 𝑤: 기울기 또는 가중치 𝑏: y절편 x=0일때. y의 예측치 4.2 선형회귀분석의 기초 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net 잔차 residual 𝑦̂와 y의 차이 (실제값과 예측값의 차이) 잔차를 그대로 더하면 부호로 인해 값이 작아지므로, 제곱합의 평균을 계..

STUDY/통계

[통계] 상관분석 | 피어슨 상관 계수

상관 분석 상관계수 Correlation coefficient 두 변수의 연관성을 -1 부터 1 사이의 수치로 나타낸 것이다. 두 변수의 연관성을 파악하기 위해 사용한다 0일땐 두 변수가 독립, 1일땐 변수 간의 변화가 정확히 일치한다고 볼 수 있다. 기울기(a) y = ax + b 라는 식에서 x가 1만큼 변할 때 y의 변화량을 나타낸다. -> 상관계수와는 다른 개념이다. 공분산 Covariance 두 변수의 상관관계를 양과 음으로 판단 두 변수의 편차를 곱한 것의 평균값 (x, y 변수가 같다면 분산과 같음) 양의 상관 관계가 있을 땐 영수, 음의 상관관계가 있을땐 음수로 나타남 피어슨 적률 상관계수 가장 대표적인 상관 계수 공분산을 두 변수의 표준편차로 나눔 더 읽어보기: https://ko.wik..

STUDY/통계

[통계] 통계적 가설 검정 | 방법과 코드

통계적 가설검정 반증주의 철학에 기반하고 있는 통계적 검정 절차 초록 글씨의 출처는 도서 귀무가설 H0 (null hypothesis) - 검정하는 사람이 '옳지 않다'고 생각하는 가설 - 기각하고자 하는 가설 - 특별한 증거가 없으면 참으로 간주한다. 대립가설 H1 (alternative hypothesis) -검정하는 사람이 '옳다'라고 생각하는 가설 - 주장하고자 하는 가설 - 충분한 증거가 필요하다 통계적 가설 검정의 흐름 (1) 귀무 가설 H0이 옳다고 한다 (2) 데이터를 분석한다 (3) 얻은 결과에 대해 다음과 같이 생각한다. 1️⃣ 귀무가설 아래에서 이 데이터가 일어나기 어려운 것이라면 귀무가설이 비정상적이라고 하여 귀무 가설을 기각하고, 대립가설을 채택한다. 2️⃣ 귀무가설 아래에서 이 ..

둥둥런
'기초통계' 태그의 글 목록