AI/기초통계

표집분포란? What is sampling distribution?

슈퍼짱짱 2019. 10. 17. 13:46
반응형

표집분포란? What is sampling distribution?


주어진 표본으로부터 모집단의 성격을 알아내고자 하는 추론이 바로 통계학에서 가장 핵심적인 부분이다.

우리는 모집단의 특성 중 어떠한 수치, 예를 들면, 모평균이나 모비율 또는 무표준편차 등에 관심이 있는 경우가 만흔데, 이러한 특성값을 모수라 하며 통계학에서 추론의 실제 대상이 된다.


모수란? 수치로 표현되는 모집단의 특성


모수의 참값은 미지의 상수로, 이를 알아내려면 모집단 전체를 다 조사해야만 한다. 그러나 이는 불가능한 경우가 많기 때문에 sampling된 표본으로 모수를 추론한다.


예를들어, 대한민국 전체 남자 키 평균을 알고싶다고 하자. 이 때, 모수는 대한민국 전체 남자 키 평균이며, 모집단은 대한민국 전체 남자가 된다. 이를 실제로 조사하는 것은 불가능에 가깝기 때문에, 나이대별 100명씩 혹은, 집단 별로 n명씩 sampling하여 이들의 평균으로 그 값을 대체한다.


표본을 이용하여 모수에 대해 추론하려면 표본에서 계산되는 적절한 양을 이용하게 되는데 이러한 양을 통계량이라 한다.


통계량이란? 표본의 고나측값들에 의하여 결정되는 양


이 때 유의할 점은

(1) 표본으로부터 계산된 통계량과 모수의 참값은 정확히 일치하지 않는다.

(2) 통계량의 값은 추출된 표본에 영향을 받는다.

(3) 다른 표본을 추출할 때마다 통계량의 값은 변한다.


통계량의 값은 매 표본추출마다 달라진다. 즉, 통계량이라는 것은 그 자체가 확률변수로서 자신의 확률분포를 갖게 된다. 


표집분포란? 통계량의 확률분포



반응형