본문 바로가기

Upstage AI Lab 2기

Upstage AI Lab 2기 [Day026] 온라인 강의 - 기초통계 (2)

Upstage AI Lab 2기

2024년 1월 17일 (수) Day_026

 

Day_026 온라인 강의 : 기초통계

더보기

나의 커리어 치트키 데이터 분석 유치원

Part.3 통계로 데이터 분석 능숙해지기
Chapter.04 통계 실험과 유의성검정 

 

CH04_01. 가설검정(1) - 가설검정이란 P값이란 0:08:46 01/17 (Wed) 1:19:02
CH04_02. 가설검정(2) - 단측검정 양측검정 0:06:00
CH04_03. 가설검정(3) - 검정에서 조심해야 할 두 가지 실수 0:07:05
CH04_04. t 검정 0:04:18
CH04_05. Project1 - 실제 데이터로 가설 설정, 검정 수행, 결과 해석하기 0:16:03
CH04_06.분산분석 0:08:31
CH04_07.실제 데이터로 가설 설정, 검정 수행, 결과 해석하기 0:13:57
CH04_08. 카이제곱검정 0:04:39
CH04_09.실제 데이터로 가설 설정, 검정 수행, 결과 해석하기 0:09:43

 

 

 

CH04_01. 가설검정(1) - 가설검정이란 P값이란

귀무가설 H0 (Null Hypothesis)

대립가설  H1 (Alternative Hypothesis)

 

 

CH04_02. 가설검정(2) - 단측검정 양측검정

단측 검정 (one-tailed test) - 한 방향성으로 가능성이 크다고 생각될 때

양측 검정 (two-tailed test) - 방향성은 모르지만 차이가 있다고 생각될 

 

 

CH04_03. 가설검정(3) - 검정에서 조심해야 할 두 가지 실수

제1종 오류

제2종 오류

도메인에 따라 제1종 오류가 치명적일 수도 있고 제2종 오류가 치명적일 수도 있다.

https://www.scribbr.com/statistics/type-i-and-type-ii-errors/

어느 강사님 말마따나 제1종 오류는 커버가 가능하지만 제2종 오류는 수습이 안 된다고....

 

 

CH04_04. t 검정

t 분포를 이용한 검정

https://en.wikipedia.org/wiki/Student%27s_t-distribution

 

두 집단, 표본분산, 표본표준편차

귀무가설 : 두 모집단의 평균간의 차이는 없다.

대립가설 : 두 모집단의 평균간의 차이가 있다.

 

t-value : [표본평균사이의 차이] / [표준오차(SE)]

 

기각역 (Critical Region)

 

 

CH04_06.분산분석(ANOVA, Analysis of Variance)

F분포 -> ANOVA

https://en.wikipedia.org/wiki/F-distribution

 

3개 이상의 다수 집단 비교

(note. t-test, chi-squared는 2개 이하 집단 비교)

 

  • 등분산성 검정
  • 정규성 검정

 

https://statswork.com/blog/compare-and-contrast-one-way-anova-and-two-way-anova-in-data-analysis/

 

one-way ANOVA (일원분산분석)

two-way ANOVA (이원분산분석)

 

검정순서

Omnibus F 검정 (-> oneway)

post hoc 검정 (사후검정)  ->  차이에 대한 유의성 검정

 

 

CH04_08. 카이제곱검정

카이제곱분포를 따를 때 (분포는 자유도에 의해 정의, 모분산 구하는 것)

A/B Test에 많이 사용됨

 

  • 독립성 검정
  • 적합성 검정
  • 동일성 검정

 


https://www.scribd.com/document/12185706/Hypothesis-Roadmap

 

기타 참고 자료:

https://velog.io/@pyose95/Data-Analysis

 

[Data Analysis] 13. 분산분석 (ANOVA; Analysis of Variance) (2)

2. ANOVA road map 3. 정규성 검정 귀무가설 : 정규분포를 따른다. 대립가설 : 정규분포를 따르지 않는다. >모든 표본 하나씩 다 확인해야 함 만약 하나의 표본이라도 귀무가설을 기각할 경우 분산 분

velog.io