통계학

베이즈 통계

베이즈 정리의 핵심 원리

베이즈 통계의 핵심은 베이즈 정리(Bayes' Theorem)입니다. 이 정리는 어떤 사건에 대한 기존의 믿음 또는 정보인 사전 확률(Prior Probability)과 새롭게 관찰된 데이터(Evidence)를 결합하여 해당 사건에 대한 업데이트된 믿음인 사후 확률(Posterior Probability)을 계산하는 방법을 제시합니다.

사전 확률의 역할과 설정

정보의 통합: 사전 확률은 과거의 연구 결과, 전문가의 의견, 또는 분석가의 주관적인 믿음 등 다양한 형태의 정보를 분석에 통합할 수 있도록 합니다. 이는 데이터가 부족하거나 불확실성이 큰 상황에서 유용한 역할을 합니다.
주관성의 반영: 사전 확률은 분석가의 주관적인 판단을 포함할 수 있다는 점에서 빈도주의 통계와 뚜렷한 차이를 보입니다. 비판적인 시각도 있지만, 이는 때로는 현실적인 지식이나 경험을 반영하여 더 나은 추론을 가능하게 합니다.
다양한 형태의 사전 분포: 사전 확률은 다양한 확률 분포의 형태로 설정될 수 있습니다. 정보가 없을 때는 모든 가능성에 대해 동일한 믿음을 나타내는 비정보적 사전 분포(Non-informative Prior)를 사용하기도 하고, 기존의 정보가 있을 때는 그 정보를 반영하는 정보적 사전 분포(Informative Prior)를 사용하기도 합니다. 사전 분포의 선택은 분석 결과에 영향을 미칠 수 있으므로 신중하게 이루어져야 합니다.

가능도 함수

데이터의 증거력: 가능도 함수는 특정 모수 값 하에서 관찰된 데이터가 발생할 확률을 나타냅니다. 높은 가능도 값은 해당 모수 값이 관찰된 데이터를 더 잘 설명한다는 의미입니다.
모수에 대한 정보: 가능도 함수는 데이터로부터 얻을 수 있는 모수에 대한 모든 정보를 담고 있습니다. 베이즈 추론은 이 가능도 함수를 사전 확률과 결합하여 최종적인 모수에 대한 믿음인 사후 확률 분포를 얻습니다.
빈도주의와의 연결: 빈도주의 통계에서도 가능도 함수는 모수 추정의 중요한 역할을 하지만, 베이즈 통계에서는 이를 사전 믿음과 통합하여 확률 분포 형태의 결론을 도출한다는 점에서 차이가 있습니다.

사후 확률 분포

불확실성의 표현: 사후 확률 분포는 모수의 단일 값으로 추정하는 것이 아니라, 가능한 모든 값과 그에 대한 믿음의 정도를 확률 분포의 형태로 제공합니다. 이를 통해 추정의 불확실성을 명확하게 파악할 수 있습니다.
의사 결정의 근거: 사후 확률 분포는 모수에 대한 점 추정값(예: 사후 평균, 사후 중앙값, 최빈값)을 얻거나, 특정 구간 내에 모수가 존재할 확률(신용 구간, Credible Interval)을 계산하는 데 사용될 수 있습니다. 이는 불확실성 하에서의 의사 결정을 지원합니다.
순차적 업데이트: 베이즈 추론의 강력한 장점 중 하나는 새로운 데이터가 관찰될 때마다 사후 확률 분포를 다시 사전 확률로 사용하여 지속적으로 업데이트할 수 있다는 점입니다. 이는 시간이 지남에 따라 우리의 믿음을 점진적으로 개선해나가는 학습 과정을 모델링합니다.

베이즈 통계의 활용 분야

의학: 질병 진단, 치료 효과 분석, 임상 시험 설계 등에서 환자의 사전 정보와 검사 결과를 결합하여 진단 정확도를 높이고 개인 맞춤형 치료 전략을 개발하는 데 사용됩니다.
기계 학습 및 인공지능: 베이지안 네트워크, 베이지안 최적화, 베이지안 딥러닝 등 다양한 베이지안 기계 학습 알고리즘이 개발되어 불확실성이 큰 상황에서의 예측 및 분류 성능을 향상시키는 데 활용됩니다.
금융: 위험 관리, 자산 가격 예측, 투자 포트폴리오 최적화 등에서 과거 데이터와 시장 상황에 대한 사전 믿음을 통합하여 보다 robust한 의사 결정을 지원합니다.
마케팅: 고객 행동 예측, 광고 효과 분석, 추천 시스템 구축 등에서 고객의 과거 구매 이력이나 선호도에 대한 사전 정보를 활용하여 개인화된 마케팅 전략을 수립하는 데 사용됩니다.
과학 및 공학: 실험 결과 분석, 모델 불확실성 평가, 예측 모델링 등 다양한 과학 및 공학 분야에서 불확실성을 정량화하고 추론의 신뢰도를 높이는 데 기여합니다.