10.1 가설검정의 이론
1. 통계적 가설과 검정통계량
가설검정은 모집단(모수)에 대한 어떠한 가설을 설정하고 그 모집단으로부터 추출한 표본을 분석함으로써 그 가설의 타당성 여부를 결정하는 것이다.
통계적 가설이 맞는지 틀린 지는 모집단 전체를 조사하지 않는 한 확실하게 알 수 없다. 그러나 모집단 전체를 조사한다는 것은 현실적으로 불가능할 뿐만 아니라 시간과 비용이 너무 많이 들어 비효율적일 때가 있다. 이러한 경우 표본을 선택하여 그 표본을 분석함으로써 모집단에 대한 주장(가설)의 타당성을 검정할 수 있다.
▼ 가설의 종류
- 귀무가설H0, Null Hypothesis | 기존에 알려진 사실을 간단하고 구체적으로 표현한 가설이다.
- 대립가설H1, Alternative Hypothesis | 실험자가 사실임을 입증하고자 하는 가설로서 귀무가설로 지정되지 않은 모든 경우를 포괄하여 설정된다.
참고로 가설검정을 수행할 때 관심 있는 가설은 귀무가설이 아니라 대립가설이고 대립가설이 참이라는 확실한 근거가 없으면 귀무가설을 채택하게 된다. 이러한 이유로 '귀무가설이 채택되었다'라는 표현 대신에 '귀무가설을 기각하지 못한다'라는 표현을 사용하기도 한다.
▼ 검정통계량
2. 제1종 오류와 제2종 오류
가설검정은 표본을 사용하여 얻어진 통계량을 기초로 해서 모집단의 특성을 구하려는 것이므로, 표본이 어떻게 선택되느냐에 따라 잘못된 결론을 내릴 수도 있게 된다.
귀무가설이 참임에도 불구하고 귀무가설을 기각하는 오류를 제1종 오류Type I error라고 부르며, 그 확률을 alpha로 표시한다. 또한 가설검정 시 제1종 오류를 범할 확률의 허용한계를 유의 수준significant level이라 한다.
또 다른 하나는 귀무가설이 틀림에도 불구하고 귀무가설을 채택하는 오류인데, 이를 제2종 오류Type II error라고 한다. 제2종 오류를 범할 확률을 beta로 표시한다.
3. 검정력
가설검정을 할 때는 유의 수준 alpha를 고정시키고 beta를 줄여 검정력을 최대화시킨다. 유의 수준을 고정시키는 이유는 제1종의 오류가 더 심각한 것으로 받아들여지기 때문이다. 따라서 우리가 허용할 수 있는 제1종의 오류를 최대로 고정시켜 그 이상은 허용하지 않겠다는 의도를 가진다.
4. 임계값critical value
귀무가설을 채택할 것인지 기각할 것인지를 판정하는 기준의 되는 값을 임계값이라고 한다. 임계값은 유의 수준, 표본크기, 검정통계량의 분포에 의해 결정된다.
채택역과 기각역은 가설의 형태에 따라 달라지는데, 모수를 theta라 하고 모수의 특정한 값을 theta0라 하면 가설은 다음 표와 같은 형태로 설정된다. 검정방법은 대립가설의 형태에 따라 단측검정one-tailed test과 양측검정two-tailed test로 구분되고, 단측검정은 우측검정right-tailed test과 좌측검정left-tailed test으로 나눠진다.
검정통계량을 T라고 하고, 임계값을 c라고 할 때 검정방법에 따른 기각역의 형태는 일반적으로 다음의 표와 같이 된다.
5. 가설검정의 절차
6. p-값의 이용
7. 구간추정과 가설검정의 관계
구간추정에 있어서의 신뢰구간과 양측 가설검정에서의 채택역은 같은 의미를 가진다. 즉, 신뢰구간은 채택가능한 귀무가설의 모수들의 집합으로 생각할 수 있다. 결국 통계적 추론에서의 구간추정과 가설검정은 서로의 보는 관점이 다를 뿐이지 별개의 것이 아니다.
10.2 단일모평균의 검정
▼ 모분산을 아는 경우 / 모르는 경우
10.3 두 모평균 차의 검정
1. 독립적인 두 표본의 경우
▼ 모분산을 아는 경우 / 모르는 경우
2. 대응표본
10.4 단일 모비율의 검정
10.5 두 모비율 차의 검정
10.6 단일 모분산의 검정
10.7 두 모분산 비의 검정
'📊 통계 > 🌱 통계학원론' 카테고리의 다른 글
제11장 범주형 자료분석 (2) | 2024.09.02 |
---|---|
제9장 구간추정 (0) | 2024.08.10 |
제8장 점추정 (0) | 2024.08.06 |
제7장 표본분포 (0) | 2024.07.31 |
제6장 이변량 확률변수 (3) | 2024.07.23 |