수학적으로 도출하는 통계 공부보다는 뜻을 정확히 이해하고 사용하기 위해 시작한 통계 포스팅이다.
데이터 유형, 표본의 수, 양적변수의 성질에 따라 가설검정 방법(어떤 분포를 선택할지)을 선택해야 한다.
모수검정(parametric test)이란
모집단이 수학적으로 다룰 수 있는(파라미터로 설명할 수 있는지) 특정 분포를 따른다는 가정을 둔 가설검정이다. 예를 들어 모집단이 정규분포라고 가정을 하면 t-검정을 한다. 반대로는 비모수검정(non-parametric test)가 있다.
1. 모수검정의 평균값 비교
-일표본 t검정 : 평균값 95% 신뢰구간 구하기와 같은 로직이다. 단, x̄를 기준으로 정리한다는 차이가 있다.

-이표본 t검정 : 정규성과 등분산성을 가정하고, 등분산성을 만족하지 않을 때는 웰치의 t검정을 진행하면 된다.
2. 비모수검정의 평균값 비교
- 윌콕슨 순위합 검정(wilcoxon rank sum test)
- 맨-휘트니 u검정
- 플리그너 플리셀로 검정(fligner-policello test)
- 브루너-문첼 검정(Brunner-munzel test)
3. 모수 검정의 3개 이상 집단의 평균값 비교 방법
분산 분석(ANOVA, analysis of variance) : F-분포 이용

이때 p값은 F값 이상으로 극단적인 값이 나올 확률이다.
다중비교:

어느 쌍에 차이가 있는지 알기 위해 하는 분석 방법이고 기본적인 아이디어는 유의수준을 엄격한 값으로 변경하는 것이다.
본페로니 교정: 매검정에서 '유의수준(a)/검정 반복 횟수(k)'를 기준으로 가설을 검정하고, 각 검정에서 p<a/k를 기준으로 대립가설을 채택한다. 유의수준을 낮추니 베타값이 높아져서 검정력이 낮아진다는 단점이 있다.
이를 보완한 검정 방법으로는
-튜키검정(Tukey's test) : 모든 쌍을 비교
-던넷검정(Dunnett's test) : 대조군과 비교에 관심
-윌리엄스 검정(Williams' test) : 집단 간 순위를 매길 수 있는 경우 용이함.
*분산분석을 한 후 p<a를 충족시키면 다중비교 하는게 일반적이지만,
분산분석에서 유의미하지 않았지만 다중비교에서는 유의미한 쌍이 있는 등 검정의 원리 차이로 인해 결과가 다를 수 있어서 이럴 경우에는 다중비교만 실행하면 된다.
4. 비모수검정의 3집단 이상 평균값 비교 방법
| 모수검정 | 비모수검정 |
| 분산분석 | Kruskal-Wallis test |
| 튜키 검정 | Steel-Dwass test |
| 던넷 검정 | Steel test |
5. 범주형 변수일때 검정방법
위에서 살펴 본 검정 방법들은 양적 변수를 대상으로 한 방법들이다. 범주형 변수일때는 이항 검정 (Binomial Test), 카이제곱 적합도 검정 (Goodness-of-Fit Test), 카이제곱 독립성 검정 (Test of Independence)의 검정방법들이 있다.
--> 카이제곱검정 추가 학습 필요!
'Data Analysis > Statistics' 카테고리의 다른 글
| [통계학] 가설검정의 주의점 (0) | 2025.02.09 |
|---|---|
| [통계학] 통계 모형화 (0) | 2025.02.08 |
| [통계학] 상관과 회귀 (0) | 2025.02.01 |
| [통계학] 가설검정과 p값 (0) | 2025.01.29 |
| [통계학] 추론통계와 신뢰구간 (0) | 2025.01.25 |