AI/기초통계

[기초통계] 통계적 추론방법 :: 점추정(Point Estimation)

슈퍼짱짱 2019. 10. 23. 08:00
반응형

통계적 추론이란?


통계적 추론이란 추출된 표본으로부터 모집단의 일반적인 특성을 추론해내는 것을 뜻한다.

표본이 추출되면 평균, 분산, 표준편차 등 표본에 대한 정보를 얻을 수 있다. 그러나 궁금한 것은 단 하나의 표본에 대한 정보가 아니라 모집단의 일반적인 특성이다. 


예를 들어, 100명의 유권자를 대상으로 후보 A에 대한 지지여부를 조사했더니 60명이 지지했다고 하자. 이 때 관심사는 이 100명의 지지율이 아니라 전체 유권자의 지지율이 될 것이다. 단, 전체 유권자를 대상으로 조사하지 않는 한 전체 유권자의 지지율을 구할 수 없으므로, 표본이 가지고 있는 정보를 이용하여 이를 추측하게 되는데 이와 같은 과정이 통계적 추론의 한 과정이라고 할 수 있다.


통계적 추론이란? 표본이 갖고 있는 정보를 분석하여 모수에 관한 결론을 유도하고, 모수에 대한 가설의 옳고 그름을 판단하는 것을 말한다.


이처럼 통계적 추론이란 모집단의 일부인 표본으로부터 전체 모집단의 성질을 추론해내는 것이기 때문에 100% 확실하다고 할 수 없다. 따라서 통계적인 추론을 할 때에는 그 결론의 부정확한 정도를 반드시 언급하여야 한다.


통계적 추론은 조사자의 관심에 따라 (1) 모수의 추정(2) 모수에 대한 가설검정이라는 두 가지 문제로 나눌 수 있다.

(1) 모수의 추정이란 미지수인 모수에 대한 추측 혹은 추측치를 그 수치화된 정확도와 함께 제시하는 것이다.

(2) 모수에 대한 가설검정이란 모수에 대한 여러가지 가설들이 적합한지 혹은 적합하지 않은 것인지를 추출된 표본으로부터 판단하는 것이다.


정규분포를 이용하여 모평균과 모비율에 대한 추정과 검정으로 위 두 가지를 설명하겠다.


예) 어느 도시에서 청소년기의 성장에 관한 연구를 하기 위해 중학교 1학년 남학생 30명을 임의추출하여 키를 측정하였다. 표본으로부터 얻은 30명 키의 평균으로 그 도시 전체 중학교 1학년 남학생의 평균키를 추론할 수 있다.


(1) μ를 하나의 값으로 추정한다. -> 점추정

(2) μ를 포함할만한 적당한 구간을 정한다. -> 구간추정

(3) μ 값이 5년 전의 평균값인 155cm와 다른지 판단한다. -> 가설검정




모수의 추정


모수의 추정에는 점추정구간추정이 있다.


점추정이란? 추철된 표본으로부터 모수의 값에 가까우리라고 예상되는 하나의 값을 제시하는 것.


구간추정이란? 하나의 값만은 제시하는 것이 아니라 모수를 포함하리라고 예상되는 적절한 구간을 구하는 것.




(1) 점추정(Point Estimation)


점추정이란 추정하고자 하는 하나의 모수에 대하여 모집단에서 임의로 추출된 n개 표본의 확률변수로 하나의 통계량을 만들고 주어진 표본으로부터 그 값을 계산하여 하나의 수치를 제시하려고 하는 것이다. 이와 같이 모수를 추정하기 위해 만들어진 통계량을 추정량(estimator)이라 하고, 주어진 관측값으로부터 계산된 추정량의 값을 추정치(estimate)라고 한다.


예를 들어, 위의 예시에서 모평균(해당도시의 중학교 1학년 남학생의 평균키)를 추정한다고 할 때, 직관적으로 가장 타당한 추정량은 표본의 평균


X̄ = 1/n(X1+...+Xn)


이다. 또한, 가 160.2cm라 할 때, 평균키의 추정치는 160.2cm가 된다.

 

추정량은 하나의 확률변수이므로 추출된 표본의 값에 따라 그 값이 달라진다. 이런 수치들의 변화의 정도는 추정량의 정확도와 관계가 있는데, 이 정확도를 측정하는 하나의 도구로 표준오차(stadard error, SE)가 있다. 표준오차는 그 값이 작을수록 좋다.

표본평균의 기댁값과 표준오차는 모집단의 평균과 표준편차가 각각 μ와 σ일 때 다음과 같이 구할 수 있다.


E() = μ, S.E.() = σ/n


따라서 X̄을 가지고 μ을 추정할 경우 n이 클수록 표준오차가 작아져 좀 더 정확한 추정이 가능해짐을 알 수 있다.

그러나 S.E.()를 계산하고자 할 때 σ이 주어져 있지 않은 경우가 많은데, 이런 경우에는 σ를 표본표준편차로 추정하여 사용할 수 있다.


sx=n1(xixˉ)2



* 모평균에 대한 점추정


모수 : 모집단의 평균 μ

자료 : 평균이 μ이고 표준편차가 σ인 모집단에서 임의추출한 표본 X1, ..., Xn

추정량 : 표본평균 

표준오차 : σ/n    추정된 표준오차 : s/n




구간추정과 가설검정에 대해서는 다음 포스팅에서 이어가도록 하겠다.


반응형