확률변수(Random variable) 중에서 이산형 자료(Discrete data)를 다루는 확률변수를 특별히 이산확률변수(Discrete random variable)이라고 부른다. 이산확률변수의 결과, 즉 실수값들에 대해 해당 값들에게 확률을 대응시키는 함수를 확률질량함수(Probability mass function)이라고 부른다.
동전을 2회 던져서 앞면의 개수를 세는 시행을 그 예로 들어 설명하면 아래와 같다.
- 동전을 2회 던지는 시행의 표본 공간은 위와 같다. S = { HH, HT, TH, TT } (H는 앞면, T는 뒷면)
- 이 표본 공간의 각 원소들을 동전 앞면의 수에 따라 확률변수로 대응시키면 아래와 같다.
- 이렇게 대응된 각 실수에게 확률을 부여하면 아래와 같다.
- 이렇게 서로 대응시킨 실수와 확률 사이의 관계를 이산형 자료에 한정하여 '확률질량함수'라고 부른다.
확률질량함수는 이산형 자료에 대해 나타내기 때문에, 그래프로 나타냈을 때 연속적인 정의역을 가지지 않는다. 위의 동전을 2회 던지는 시행에 대한 확률질량함수 f(X = x)를 그래프로 나타내면 아래와 같다.
선형대수에서 일반적으로 다루는 일차함수, 이차함수 등의 정의역이 연속적인 다항함수와는 달리 정의역과 치역이 단절되어 있는 모습을 확인할 수 있다.
이러한 확률질량함수는 정의역의 모든 x에 대하여 다음 세 가지 특징을 가진다.
$$ \begin{flalign*} 1. f(x) \geq 0 && \end{flalign*} $$
$$ \begin{flalign*} 2. \underset{i = 1}{\overset{\infty}\Sigma} f(x_{i}) = 1 && \end{flalign*} $$
$$ \begin{flalign*} 3. P(X = x) = f(x) && \end{flalign*} $$
확률질량함수와 같이 확률변수의 결과값인 실수를 정의역으로, 그에 대응되는 확률을 치역으로 설정하는 함수를 통틀어 확률분포(Probability distribution)이라고 부른다. 이는 각 실수마다 '분포'된 '확률'을 나타내는 함수라 하여 붙여진 이름이다.
'통계학 > 기초 통계' 카테고리의 다른 글
[기초 통계] 14. 확률밀도함수: Probability Density Function (0) | 2023.01.24 |
---|---|
[기초 통계] 13. 이산확률변수의 누적분포함수: Cumulative Distribution Function of Discrete Random Variable (0) | 2023.01.24 |
[기초 통계] 11. 확률변수: Random Variable (0) | 2023.01.23 |
[기초 통계] 10. 베이즈 정리: Bayes' Theorem (0) | 2023.01.22 |
[기초 통계] 9. 전체 확률의 법칙: Law of Total Probability (2) | 2023.01.22 |