누적분포함수(Cumulative distribution function)는 정의역 X의 값이 증가함에 따라 확률이 점차 누적되는 함수를 말한다.
이전 포스트에서 다룬 확률질량함수와 이번 포스트에서 다룰 누적분포함수의 차이는 다음과 같이 비유할 수 있다.
- 확률질량함수: 불량률 10%인 제품 제조 공정으로부터 n개의 제품을 추출하는 시행에서 불량품 x개를 뽑을 확률
- 누적분포함수: 불량률 10%인 제품 제조 공정으로부터 n개의 제품을 추출하는 시행에서 불량품 x개 이하를 뽑을 확률
이전의 '동전 2회를 던져서 앞면의 개수를 세는 시행'을 다시 예시로 들자.
위와 같은 표본 공간과 이산확률변수, 확률질량함수의 관계가 존재한다고 가정하자.
위 예시에 대한 확률질량함수의 그래프는 아래와 같다.
위의 확률질량함수에서는 P(X = 0) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4이다.
이를 누적분포함수로 바꾸면 아래와 같은 그래프가 된다.
여기에서 F(X = 0)은 확률질량함수와 동일하게 1/4이지만, F(X = 1)은 1/4 + 1/2인 3/4이고, F(X = 2)부터는 1/4 + 1/2 + 1/4인 1의 값을 가진다.
이처럼 누적분포함수는 확률질량함수에서 해당 X값보다 작은 모든 X값들이 가지는 모든 확률이 누적된 치역을 가진다.
누적분포함수 F(x)에 대한 특성을 수식으로 나타내면 아래와 같다.
$$ F(x) = P(X = x) = \underset{t \leq x} \Sigma f(t), for -\infty \leq x \leq \infty $$
'통계학 > 기초 통계' 카테고리의 다른 글
[기초 통계] 15. 연속확률변수의 누적분포함수: Cumulative Distribution Function of Continuous Random Variable (0) | 2023.01.25 |
---|---|
[기초 통계] 14. 확률밀도함수: Probability Density Function (0) | 2023.01.24 |
[기초 통계] 12. 확률질량함수: Probability Mass Function (0) | 2023.01.24 |
[기초 통계] 11. 확률변수: Random Variable (0) | 2023.01.23 |
[기초 통계] 10. 베이즈 정리: Bayes' Theorem (0) | 2023.01.22 |