통계학/이산확률분포 / / 2023. 2. 20. 23:06

[이산확률분포] 4. 초기하 분포: Hypergeometric Distribution

  초기하 분포(Hypergeometric Distribution)는 이산확률분포의 일종으로, 이항 분포와는 비슷하지만 다른 이산확률분포라고 할 수 있다.

 

  구슬 주머니에 빨간 구슬 5개, 파란 구슬 3개, 초록 구슬 3개로 총 11개의 구슬이 있다고 가정하자. 이 11개의 구슬이 들어있는 주머니에서 무작위로 3개의 구슬을 꺼내는 시행을 한다고 가정하자. 이 때 추출된 3개의 구슬들 중 빨간 구슬이 2개 포함되어 있을 확률을 구할 때, 우리는 초기하 분포를 사용하여 그 확률을 구할 수 있다.

 

  초기하 분포와 이항 분포의 차이점 중 하나는, 초기하 분포는 비복원 추출, 이항 분포는 복원 추출을 전제한 확률분포라는 점이다.

 

  초기하 분포는 한 번 특정 원소를 추출하면 해당 원소를 다시 추출할 수 없는 것을 전제로 하지만, 이항 분포는 특정 원소를 추출하더라도 그 원소를 다시 '복원'하여 추출할 수 있다는 것을 전제한다. 한 마디로 10개의 각기 다른 구슬에서 3개의 구슬을 추출하는 시행을 가정할 때, 초기하 분포는 10개의 구슬을 추출할 때 그 경우의 수가 10 * 9 * 8 = 720가지인 것이지만, 이항 분포는 10^3 = 1,000가지의 경우의 수를 가질 수 있는 것이다.

 

  N을 모집단의 수, k를 구하고자 하는 대상의 수, x를 구하고자 하는 대상의 표본 내에서 목표하는 수, n을 추출한 표본의 수라고 할 때, 초기하 분포의 확률질량함수 f(x)는 아래와 같다.

 

$$ f(x) = \frac{_{k}C_{x} \cdot _{N - k}C_{n - x}}{_{N}C_{n}} $$

 

  초기하 분포의 확률변수 X의 기댓값과 분산은 아래와 같다.

 

$$ \begin{align} & E(X) = \frac{nk}{N} \\ & Var(X) = (\frac{N - n}{N - 1}) \cdot n \cdot \frac{k}{N} \cdot (1 - \frac{k}{N}) \end{align} $$

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유