가설검정
귀무 가설과 대립 가설
귀무 가설 (Null Hypothesis, H 0): 기존에 받아들여지던 사실, 변화가 없다거나, 비교하는 집단 간에 차이가 없다는 주장입니다. 연구자가 기각하고자 하는 가설이며, 통계적으로 검정의 대상이 됩니다. 귀무 가설은 일반적으로 등호(=), 부등호 (≥,≤)를 포함하는 형태로 설정됩니다.
대립 가설 (Alternative Hypothesis): 연구자가 입증하고자 하는 주장, 변화가 있다거나, 비교하는 집단 간에 차이가 있다는 주장입니다. 귀무 가설이 기각될 때 채택되는 가설이며, 일반적으로 부등호 (
>,<)를 포함하는 형태로 설정됩니다.
검정 통계량과 유의 수준
검정 통계량 (Test Statistic): 표본 데이터를 이용하여 귀무 가설이 얼마나 그럴듯하지 않은지를 측정하는 값입니다. 검정 통계량의 종류는 분석하려는 데이터의 종류, 표본 크기, 모집단의 특성 등에 따라 달라집니다. 주요 검정 통계량으로는 t-값, Z-값, F-값, 카이제곱 값 등이 있습니다.
유의 수준 (Significance Level, α): 귀무 가설이 실제로 참인데도 불구하고 이를 기각하는 오류(제1종 오류)를 범할 최대 허용 확률입니다. 일반적으로 0.05 (5%) 또는 0.01 (1%)이 많이 사용됩니다. 유의 수준은 연구자가 사전에 결정하며, 통계적 판단의 엄격성을 나타냅니다.
p-값과 임계값
검정 통계량을 계산한 후, 이를 이용하여 귀무 가설의 기각 여부를 결정하는 두 가지 주요 방법이 있습니다.
p-값 (p-value): 귀무 가설이 참이라고 가정했을 때, 관찰된 표본 데이터 또는 그보다 더 극단적인 결과가 나타날 확률입니다.
임계값 (Critical Value): 미리 설정한 유의 수준 (α)에 따라 결정되는 값으로, 검정 통계량과 비교하여 귀무 가설의 기각 여부를 결정하는 기준이 됩니다. 검정 통계량의 분포와 유의 수준에 따라 임계값이 달라집니다.
제1종 오류와 제2종 오류
제1종 오류 (Type I Error, α 오류): 귀무 가설이 실제로 참인데, 표본 데이터의 변동성 때문에 귀무 가설을 기각하는 오류입니다. 제1종 오류를 범할 확률은 유의 수준 (α)으로 통제됩니다. "실제로 효과가 없는 새로운 치료법을 효과가 있다고 잘못 결론 내리는 경우"가 예시입니다.
제2종 오류 (Type II Error, β 오류): 귀무 가설이 실제로 거짓인데, 표본 데이터의 변동성 때문에 귀무 가설을 기각하지 못하는 오류입니다. 제2종 오류를 범할 확률은 β로 표시하며, 검정력 (1−β)은 귀무 가설이 거짓일 때 이를 올바르게 기각할 확률을 의미합니다. "실제로 효과가 있는 새로운 치료법을 효과가 없다고 잘못 결론 내리는 경우"가 예시입니다.
다양한 가설 검정 방법
연구 질문의 성격, 데이터의 유형, 표본 수 등에 따라 다양한 가설 검정 방법이 존재합니다. 주요 가설 검정 방법은 다음과 같습니다.
단일 표본 검정 (One-Sample Tests): 하나의 표본에서 얻은 통계량이 특정 모집단 모수와 다른지 검정합니다 (예: 단일 표본 t-검정, 단일 비율 검정).
두 표본 검정 (Two-Sample Tests): 두 독립된 모집단 또는 관련된 모집단에서 추출한 두 표본의 통계량을 비교합니다 (예: 독립 표본 t-검정, 대응 표본 t-검정, 두 비율 검정).
분산 분석 (ANOVA): 세 개 이상의 모집단 평균을 동시에 비교합니다.
상관 분석 (Correlation Analysis): 두 변수 간의 선형적인 관계가 통계적으로 유의미한지 검정합니다.
회귀 분석 (Regression Analysis): 독립 변수가 종속 변수에 미치는 영향이 통계적으로 유의미한지 검정합니다.
카이제곱 검정 (Chi-Square Tests): 범주형 데이터의 분포를 분석하거나, 두 범주형 변수 간의 독립성을 검정합니다 (예: 적합도 검정, 독립성 검정, 동질성 검정).