베이즈 정리(Bayes' Theorem)은 조건부 확률(Conditional probability)를 기반으로 잉글랜드의 목사 토머스 베이즈(Thomas Bayes, 1702-1761)가 제시한 정리이다.
베이즈 정리는 확률의 곱셈정리와 전체 확률의 법칙을 활용하여 증명할 수 있다.
베이즈 정리의 공식과 그 증명은 아래와 같다.
$$ \begin{align} P(B|A) & = \frac{P(B \cap A)}{P(A)}\\ & = \frac{P(B)P(A|B)}{P(A)}\\ & = \frac{P(B)P(A|B)}{P(A \cap B) + P(A \cap B')}\\ & = \frac{P(B)P(A|B)}{P(B)P(A|B)+P(B')P(A|B')} \end{align} $$
베이즈 정리의 의미는 조건부 확률에서 전제 사건과 관심 사건의 위치를 뒤바꿀 수 있다는 것에 있다. P(A|B), P(B)의 두 확률을 알고 있으면 그를 활용해 P(B|A)를 도출해 낼 수 있는 것이 베이즈 정리의 핵심이다.
즉, 베이즈 정리를 활용하면 '관심 사건을 전제로 한 전제 사건의 확률'을 구할 수 있다.
일례로 아래와 같은 상황을 가정해 보자.
- 어느 질병에 대해 해당 질병을 검사했을 때 '실제로 해당 질병에 걸린 사람이 양성으로 판정될 확률'이 95%이다. '실제로 해당 질병에 걸리지 않은 사람이 음성으로 판정될 확률'은 90%이다. 해당 질병에 걸린 사람은 전체 인원의 60%이다. 이 때 '양성으로 판정된 사람이 실제로 해당 질병에 걸려있을 확률'을 구하시오.
이 때 베이즈 정리를 활용하면 쉽게 그 확률을 구할 수 있다.
$$ P(D|P)= \\ \frac{P(D)P(P|D)}{P(D)P(P|D)+P(not D)P(P|not D)}$$
P(P|D)는 '실제로 해당 질병에 걸린 사람이 양성으로 판정될 확률'이고, P(D)는 '전체 인원에 대하여 해당 질병에 걸린 사람의 비율'이다. P(not D)는 '전체 인원에 대하여 해당 질병에 걸리지 않은 사람의 비율,' 즉 P(D)의 여사건이고, P(P|not D)는 '해당 질병에 걸리지 않았는데도 양성으로 판정될 확률,' 즉 P(N|not D)의 여사건이다.
P(P|D) = 0.95, P(P|not D) = 0.1, P(D) = 0.6, P(not D) = 0.4이므로 그 계산 결과는 아래와 같다.
$$ \begin{align} P(D|P) & = \frac{P(D)P(P|D)}{P(D)P(P|D)+P(not D)P(P|not D)}\\ & = \frac{0.6 \times 0.95}{0.6 \times 0.95 + 0.4 \times 0.1}\\ & = \frac{0.57}{0.57 + 0.04} \simeq 0.934 \end{align} $$
그러므로 위 예시에서 '양성으로 판정된 사람이 실제로 해당 질병에 걸려있을 확률'은 93.4%에 근사한다.
이처럼 베이즈 정리를 활용하면 전제 사건과 관심 사건의 위치를 뒤바꾼 역확률(Inverse probability)을 쉽게 구할 수 있다.
사건의 개수를 n개로 확장시켜 보다 일반화시킨 베이즈 정리는 아래와 같다.
$$ \begin{align} P(B_{i}|A) & = \frac{P(B_{i} \cap A)}{P(A)}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(A)}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(A \cap B_{1}) + P(A \cap B_{2} + ... + P(A \cap B_{n})}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(B_{1})P(A|B_{1}) + P(B_{2})P(A|B_{2}) + ... + P(B_{n})P(A|B_{n})} \end{align} $$
'통계학 > 기초 통계' 카테고리의 다른 글
[기초 통계] 12. 확률질량함수: Probability Mass Function (0) | 2023.01.24 |
---|---|
[기초 통계] 11. 확률변수: Random Variable (0) | 2023.01.23 |
[기초 통계] 9. 전체 확률의 법칙: Law of Total Probability (2) | 2023.01.22 |
[기초 통계] 8. 조건부 확률: Conditional Probability (0) | 2023.01.21 |
[기초 통계] 7. 확률의 공리적 정의: Probability (0) | 2023.01.20 |