통계학/기초 통계 / / 2023. 1. 19. 13:19

[기초 통계] 1. 모집단과 표본: Population, Sample

  통계학은 그 자체만으로도 한 학문의 태를 이루고 있으나, 또한 다른 학문들에서 제시하는 이론, 가설 등을 검정하는 데에 있어서 방법론적인 차원으로 이용되기도 하며, 또한 그것이 학문의 큰 축을 이루고 있다는 점이 썩 특이한 학문이다.

 

  통계학에 대해 무지한 사람은 통계학의 역할이 그저 어딘가에서 수집된 설문조사 따위의 결과에서 평균, 편차를 구하는 데에 그 전체 학문의 의의가 존재한다고 단순하게 생각할 수도 있을 것이다. 그러나 통계학에 대해서 점점 더 깊숙하게 파고들며 공부를 하다 보면, 겉으로 보기에는 쉬워보이던 이 통계학이라는 것이 그렇게 녹록치만은 않은 학문이라는 사실을 서서히 깨달을 수 있다. 특히나 수학과는 담을 쌓고 있던 문과 전공의 대학생들이 사회조사방법론 따위의 과목에서 처음 통계학을 접하며 그 생소함과 어려움에 머리를 싸매는 경우도 적지 않다.

 

  그럼에도 통계학을 연구하고 공부하는 사람들이 적지 않은 것은, 이과적 지식을 접목하여 문과적 이론을 검증한다는, 통계학만이 가진 문이과의 적절한 조화라는 특징과 더불어, 통계학이 없었다면 단순한 특정인의 추측에 불과했을 사회학적인 명제를 수학적 지식을 활용하여 객관적으로 검증하여 학문적으로 유의미하게 '명제'를 '이론'으로 재탄생시킬 수 있다는 통계학만의 매력이 여러 사람들에게 충분히 어필될 만한 확실하고 강력한 학술적 이점으로 다가왔기 때문일 것이다.

 

  필자는 대학에서 본인의 호오, 의지 등과는 관련없이 전공 필수 과목의 일종으로서 통계학을 공부하기 시작했다. 처음에는 통계학을 공부하는 데에 있어서 큰 어려움을 느꼈고, 단순히 설문조사 등으로 도출된 결과를 수식적, 도식적으로 정리하여 가설에 신빙성을 더해줄 뿐인 사회학적인 방법론의 일종으로만 통계학을 대하였다.

 

  그러나 통계학에 대해 배우면 배울 수록, 통계학만이 가진 특별한 매력과 이점을 느끼면서 점점 더 통계학에 대해 공부하게 되었다. 지금 역시도 통계학에 대해 계속해서 알아가고 있다.

 

  이 글을 시작으로 해당 블로그에선 통계학을 구성하고 있는 여러 통계학적 개념들에 대해서 알아본다. 또한 이 개념들이 실제 사회조사 등에서 어떻게 방법론으로써 사용되는지 등에 관하여 기초부터 차근차근 알아볼 수 있도록 한다.

 

 

 

  통계학의 주된 목적 중 하나는 특정한 목적을 가지고 모집단(Population)의 특성을 통계를 활용하여 분석하는 것이다. '대한민국 남성들의 평균 IQ'를 조사 대상으로 삼은 설문조사에서, '대한민국 남성'을 모집단의 예시로서 들 수 있겠다.

 

  통계학에서 대상이 되는 모집단은 대체로 그 규모가 매우 크기 때문에, 모집단의 모든 데이터를 수집하여 통계를 내는 것은 현실적으로 불가능하다. 그래서 일반적으로 통계학에선 모집단에서 일부의 데이터만을 추출하여 만든 표본(Sample)을 활용한다. 통계학은 표본의 데이터를 통해 모집단의 특성을 예측하는 것을 목표로 하는데, 이를 통계적 추론(Statistical Inference)라고 한다.

 

 

  예를 들어서 대한민국 전체 자동차의 평균 1년 주행거리를 조사하기 위해 무작위로 대한민국의 자동차 1,000대를 추출해 통계를 냈다고 가정하자. 원래 대한민국 자동차의 평균 1년 주행거리는 50,000km인데, 통계 결과 45,000km라는 결과가 나왔다. 여기에서는 대한민국 전체 자동차모집단, 무작위로 추출된 1,000대의 자동차가 표본이다.

 

  또한 통계에서 목표하는 모집단의 특성, 즉 위의 예시에서는 대한민국 전체 자동차의 평균 1년 주행거리 50,000km를 통계학에서는 모수(Parameter)라고 부르고, 표본에서 모수를 예측하기 위해 계산된 결과, 즉 위의 예시에서는 대한민국 자동차 1,000대를 대상으로 한 통계의 결과인 45,000km를 통계학에서는 통계량(Statistics)라고 부른다.

 

  통계학의 기본적인 목표는 표본에서 도출된 통계량으로 모집단의 모수를 추정하는 것이다.

 

  아래는 모집단과 표본, 모수와 통계량에 대한 간단한 예제이다.

 

 

  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유