유의확률(P-value)란?
이전에 주어진 유의수준을 갖는 기각역을 구하는 방법을 알아보았다.
표본으로부터 계산된 Z의 값으로부터 그 값이 기각역에 포함되면 \(H_{0}\)를 기각하고, 그렇지 않으면 \(H_{0}\)를 기각하지 않는다.
예를 들어) 유의수준 5%를 갖는 기각역으로 \(R : Z \le -1.645\)를 구하였다고 하자.
표본으로부터 Z를 계산하여 z=-1.95로 얻었다면 \(H_{0}\)를 기각할 수 있고, z=-1.42를 얻었다면 \(H_{0}\)를 기각할 수 없다.
이 수치는 기각의 여부 뿐 아니라 얼마나 확실하게 기각할 수 있는가를 판단할 수도 있다.
예를 들어 z=-2.22로 얻어졌다면, \(\alpha\)를 0.05에서 0.025로 줄여도 (\(R:Z \le -1.645\) -> \(R:Z \le -1.96\)) 여전히 \(H_{0}\)를 기각할 수 있다.
즉, 얻어진 Z의 값으로부터 \(H_{0}\)를 기각할 수 있게 하는 최소의 유의수준이 작을수록 더욱 확실하게 \(H_{0}\)를 기각하게(\(H_{1}\)을 채택하게) 된다.
그렇다면, 얻어진 Z의 값을 가지고 기각할 수 있게 하는 최소의 유의수준은 어떻게 구할 수 있을까?
예를 들어) 콜레스테롤 수치를 낮춰주기 위해 신약을 개발했다고 하자. 이 약이 효과가 있는지, 없는지 검증하는 과정에서 z=-2.22의 값이 얻어졌다고 하자. 이 때 이 값으로 \(H_{0}\)를 기각하기 위한 최소의 유의수준은 \(P(Z \le -2.22)=0.0132\) 이다. 즉, 이 예시에서 표본으로부터 관측된 Z값으로 \(H_{0}\)를 기각할 수 있는 최소의 유의수준은 0.0132이며, 이를 P-값(P-value) 혹은 유의확률(significance probability)라 한다.
P-value란? 주어진 검정통계량의 관측치로부터 \(H_{0}\)를 기각하게 하는 최소의 유의수준
* Z=z일 때 각 기각역의 형태에 따라 P-value 구하는 방법
$$ R : Z \le d \quad P-value=P(Z \le z) $$
$$ R : Z \ge d \quad P-value=P(Z \ge z) $$
$$ R : \left|Z \right| \le d \quad P-value=P(\left|Z \right| \le z) $$
이에 따라, 계산된 P-value값이 원하는 유의수준보다 작으면 \(H_{0}\)를 기각할 수 있고, 유의수준보다 크면 \(H_{0}\)를 기각할 수 없다.
예를 들어) 계산된 P-value값이 0.024라 할 때, 원하는 유의수준이 0.01이면 기각할 수 없고, 0.05이면 기각할 수 있다.
실제로 많은 통계 프로그램들이 P-value를 output으로 떨군다. 기각역을 일일히 계산하기 보단 P-value 위주로 계산한다.
또한, 계산된 P-value는 \(H_{1}\)을 채택하는 근거의 척도로도 볼 수 있다. P-value가 0.024일 때보다 0.002일 때 더 확실히 \(H_{0}\)를 기각할 수 있다.
위의 예시를 그림으로 그리면 다음과 같다.
유의수준(\(\alpha\)) = 0.05에서 기각역(c) = -1.645 이고, 표본으로부터 계산된 z=-2.22일 때 P-value=0.0132이다.
이 예시에서 P-value = 0.0132는 유의수준 0.05보다 작기때문에 \(H_{0}\)를 기각할 수 있음을 알 수 있다.
'AI > 기초통계' 카테고리의 다른 글
[기초통계] 모평균 비교 :: 두 모집단이 독립일때와 독립이 아닐 때 (0) | 2019.11.24 |
---|---|
[기초통계] t-distribution :: 표본의 크기가 작을 때 :: n에 따른 t분포 in R (4) | 2019.11.23 |
[기초통계] 기각역이란? :: 제 1종오류와 제 2종오류의 관계 :: 단측검정, 양측검정 (0) | 2019.11.21 |
[기초통계] 가설검정에서 오류란? :: 제 1종오류란? 제 2종오류란? :: 제 1종오류가 제 2종오류보다 중요한 이유 (0) | 2019.11.14 |
[기초통계] 가설검정이란? (2) | 2019.11.13 |