통계학/기초 통계 / / 2023. 1. 22. 08:55

[기초 통계] 10. 베이즈 정리: Bayes' Theorem

  베이즈 정리(Bayes' Theorem)은 조건부 확률(Conditional probability)를 기반으로 잉글랜드의 목사 토머스 베이즈(Thomas Bayes, 1702-1761)가 제시한 정리이다.

 

  베이즈 정리는 확률의 곱셈정리전체 확률의 법칙을 활용하여 증명할 수 있다.

 

  베이즈 정리의 공식과 그 증명은 아래와 같다.

 

$$ \begin{align} P(B|A) & = \frac{P(B \cap A)}{P(A)}\\ & = \frac{P(B)P(A|B)}{P(A)}\\ & = \frac{P(B)P(A|B)}{P(A \cap B) + P(A \cap B')}\\ & = \frac{P(B)P(A|B)}{P(B)P(A|B)+P(B')P(A|B')} \end{align} $$

 

  베이즈 정리의 의미는 조건부 확률에서 전제 사건과 관심 사건의 위치를 뒤바꿀 수 있다는 것에 있다. P(A|B), P(B)의 두 확률을 알고 있으면 그를 활용해 P(B|A)를 도출해 낼 수 있는 것이 베이즈 정리의 핵심이다.

 

  즉, 베이즈 정리를 활용하면 '관심 사건을 전제로 한 전제 사건의 확률'을 구할 수 있다.

 

  일례로 아래와 같은 상황을 가정해 보자.

 

  - 어느 질병에 대해 해당 질병을 검사했을 때 '실제로 해당 질병에 걸린 사람이 양성으로 판정될 확률'이 95%이다. '실제로 해당 질병에 걸리지 않은 사람이 음성으로 판정될 확률'은 90%이다. 해당 질병에 걸린 사람은 전체 인원의 60%이다. 이 때 '양성으로 판정된 사람이 실제로 해당 질병에 걸려있을 확률'을 구하시오.

 

  이 때 베이즈 정리를 활용하면 쉽게 그 확률을 구할 수 있다.

 

$$ P(D|P)= \\ \frac{P(D)P(P|D)}{P(D)P(P|D)+P(not D)P(P|not D)}$$

 

  P(P|D)는 '실제로 해당 질병에 걸린 사람이 양성으로 판정될 확률'이고, P(D)는 '전체 인원에 대하여 해당 질병에 걸린 사람의 비율'이다. P(not D)는 '전체 인원에 대하여 해당 질병에 걸리지 않은 사람의 비율,' 즉 P(D)의 여사건이고, P(P|not D)는 '해당 질병에 걸리지 않았는데도 양성으로 판정될 확률,' 즉 P(N|not D)의 여사건이다.

 

  P(P|D) = 0.95, P(P|not D) = 0.1, P(D) = 0.6, P(not D) = 0.4이므로 그 계산 결과는 아래와 같다.

 

$$ \begin{align} P(D|P) & = \frac{P(D)P(P|D)}{P(D)P(P|D)+P(not D)P(P|not D)}\\ & = \frac{0.6 \times 0.95}{0.6 \times 0.95 + 0.4 \times 0.1}\\ & = \frac{0.57}{0.57 + 0.04} \simeq 0.934 \end{align} $$

 

  그러므로 위 예시에서 '양성으로 판정된 사람이 실제로 해당 질병에 걸려있을 확률'은 93.4%에 근사한다.

 

  이처럼 베이즈 정리를 활용하면 전제 사건과 관심 사건의 위치를 뒤바꾼 역확률(Inverse probability)을 쉽게 구할 수 있다.

 

  사건의 개수를 n개로 확장시켜 보다 일반화시킨 베이즈 정리는 아래와 같다.

 

$$ \begin{align} P(B_{i}|A) & = \frac{P(B_{i} \cap A)}{P(A)}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(A)}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(A \cap B_{1}) + P(A \cap B_{2} + ... + P(A \cap B_{n})}\\ & = \frac{P(B_{i})P(A|B_{i})}{P(B_{1})P(A|B_{1}) + P(B_{2})P(A|B_{2}) + ... + P(B_{n})P(A|B_{n})} \end{align} $$

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유