통계학/기초 통계 / / 2023. 1. 24. 15:33

[기초 통계] 12. 확률질량함수: Probability Mass Function

  확률변수(Random variable) 중에서 이산형 자료(Discrete data)를 다루는 확률변수를 특별히 이산확률변수(Discrete random variable)이라고 부른다. 이산확률변수의 결과, 즉 실수값들에 대해 해당 값들에게 확률을 대응시키는 함수를 확률질량함수(Probability mass function)이라고 부른다.

 

  동전을 2회 던져서 앞면의 개수를 세는 시행을 그 예로 들어 설명하면 아래와 같다.

 

 

  - 동전을 2회 던지는 시행의 표본 공간은 위와 같다. S = { HH, HT, TH, TT } (H는 앞면, T는 뒷면)

 

  - 이 표본 공간의 각 원소들을 동전 앞면의 수에 따라 확률변수로 대응시키면 아래와 같다.

 

 

  - 이렇게 대응된 각 실수에게 확률을 부여하면 아래와 같다.

 

 

  - 이렇게 서로 대응시킨 실수와 확률 사이의 관계를 이산형 자료에 한정하여 '확률질량함수'라고 부른다.

 

 

  확률질량함수는 이산형 자료에 대해 나타내기 때문에, 그래프로 나타냈을 때 연속적인 정의역을 가지지 않는다. 위의 동전을 2회 던지는 시행에 대한 확률질량함수 f(X = x)를 그래프로 나타내면 아래와 같다.

 

 

  선형대수에서 일반적으로 다루는 일차함수, 이차함수 등의 정의역이 연속적인 다항함수와는 달리 정의역과 치역이 단절되어 있는 모습을 확인할 수 있다.

 

  이러한 확률질량함수는 정의역의 모든 x에 대하여 다음 세 가지 특징을 가진다.

 

$$ \begin{flalign*} 1. f(x) \geq 0 && \end{flalign*} $$

$$ \begin{flalign*} 2. \underset{i = 1}{\overset{\infty}\Sigma} f(x_{i}) = 1 && \end{flalign*} $$

$$ \begin{flalign*} 3. P(X = x) = f(x) && \end{flalign*} $$

 

  확률질량함수와 같이 확률변수의 결과값인 실수를 정의역으로, 그에 대응되는 확률을 치역으로 설정하는 함수를 통틀어 확률분포(Probability distribution)이라고 부른다. 이는 각 실수마다 '분포'된 '확률'을 나타내는 함수라 하여 붙여진 이름이다.

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유