확률변수(Random variable)이란 일종의 함수로, '표본 공간 내의 원소를 각각 수치적인 실수와 대응시킨 함수'를 확률변수라고 한다.
확률변수의 예시는 아래와 같다.
- 동전을 2회 던지는 시행이 존재할 때, 그에 대한 표본 공간은 아래와 같다.
- S = { HH, HT, TH, TT} (H는 동전의 앞면, T는 동전의 뒷면)
- 여기에서 우리의 관심사는 '동전을 2회 던지는 시행에서 앞면이 얼마나 나왔는가'이다. 이에 대해 각 원소들마다 포함하고 있는 앞면의 수다. 해당 시행에서 나올 수 있는 앞면의 수는 0 (TT), 1 (HT, TH), 2 (HH)이다. 이를 그림으로 나타내면 아래와 같다.
- HH는 2, HT와 TH는 1, TT는 0이라는 실수에 각각 대응시킬 수 있다. 이는 마치 정의역의 값 하나와 치역의 값 하나가 서로 대응되는 함수의 관계와 같다고 할 수 있다. 이렇듯 표본 공간의 원소들과 수치적인 실수를 대응시키는 일종의 함수를 통계학에선 확률변수라고 부른다.
- '동전을 2회 던지는 시행'의 확률변수와 그에 대응하는 확률을 도식화하여 나타내면 아래와 같다.
- 위 도식에서 동전을 2회 던지는 시행에서 앞면의 수를 확률변수 X라 할 때, P(X = 0) = 1/4, P(X = 1) = 1/2, P(X = 2) = 1/4라고 할 수 있다.
확률변수에는 데이터의 유형에 따라 이산확률변수(Discrete random variable)와 연속확률변수(Continuous random variable)가 존재한다. 이산확률변수는 이산형 자료(Discrete data)에 대한 확률변수로, 위와 같이 동전을 던지는 등 횟수를 세거나 인원을 세는 확률변수가 이산확률변수의 일종이라고 할 수 있다. 연속확률변수는 연속형 자료(Continuous data)에 대한 확률변수로, 사람의 신장이나 몸무게, 시간, 길이와 같은 소수점 단위로 나타날 수 있는 데이터에 대한 확률변수가 연속확률변수의 일종이라고 할 수 있다.
'통계학 > 기초 통계' 카테고리의 다른 글
[기초 통계] 13. 이산확률변수의 누적분포함수: Cumulative Distribution Function of Discrete Random Variable (0) | 2023.01.24 |
---|---|
[기초 통계] 12. 확률질량함수: Probability Mass Function (0) | 2023.01.24 |
[기초 통계] 10. 베이즈 정리: Bayes' Theorem (0) | 2023.01.22 |
[기초 통계] 9. 전체 확률의 법칙: Law of Total Probability (2) | 2023.01.22 |
[기초 통계] 8. 조건부 확률: Conditional Probability (0) | 2023.01.21 |