AI/기초통계

[기초통계] 유의확률이란? P-value란?

슈퍼짱짱 2019. 11. 22. 10:00
반응형

유의확률(P-value)란?


이전에 주어진 유의수준을 갖는 기각역을 구하는 방법을 알아보았다. 

표본으로부터 계산된 Z의 값으로부터 그 값이 기각역에 포함되면 \(H_{0}\)를 기각하고, 그렇지 않으면 \(H_{0}\)를 기각하지 않는다.


예를 들어) 유의수준 5%를 갖는 기각역으로 \(R : Z \le -1.645\)를 구하였다고 하자.

표본으로부터 Z를 계산하여 z=-1.95로 얻었다면 \(H_{0}\)를 기각할 수 있고, z=-1.42를 얻었다면 \(H_{0}\)를 기각할 수 없다.


이 수치는 기각의 여부 뿐 아니라 얼마나 확실하게 기각할 수 있는가를 판단할 수도 있다.

예를 들어 z=-2.22로 얻어졌다면, \(\alpha\)를 0.05에서 0.025로 줄여도 (\(R:Z \le -1.645\) -> \(R:Z \le -1.96\)) 여전히 \(H_{0}\)를 기각할 수 있다.


즉, 얻어진 Z의 값으로부터 \(H_{0}\)를 기각할 수 있게 하는 최소의 유의수준이 작을수록 더욱 확실하게 \(H_{0}\)를 기각하게(\(H_{1}\)을 채택하게) 된다.


그렇다면, 얻어진 Z의 값을 가지고 기각할 수 있게 하는 최소의 유의수준은 어떻게 구할 수 있을까?


예를 들어) 콜레스테롤 수치를 낮춰주기 위해 신약을 개발했다고 하자. 이 약이 효과가 있는지, 없는지 검증하는 과정에서 z=-2.22의 값이 얻어졌다고 하자. 이 때 이 값으로 \(H_{0}\)를 기각하기 위한 최소의 유의수준은 \(P(Z \le -2.22)=0.0132\) 이다. 즉, 이 예시에서 표본으로부터 관측된 Z값으로 \(H_{0}\)를 기각할 수 있는 최소의 유의수준은 0.0132이며, 이를 P-값(P-value) 혹은 유의확률(significance probability)라 한다.


P-value란? 주어진 검정통계량의 관측치로부터 \(H_{0}\)를 기각하게 하는 최소의 유의수준


* Z=z일 때 각 기각역의 형태에 따라 P-value 구하는 방법


$$ R : Z \le d \quad P-value=P(Z \le z) $$

$$ R : Z \ge d \quad P-value=P(Z \ge z) $$

$$ R : \left|Z \right| \le d \quad P-value=P(\left|Z \right| \le z) $$


이에 따라, 계산된 P-value값이 원하는 유의수준보다 작으면 \(H_{0}\)를 기각할 수 있고, 유의수준보다 크면 \(H_{0}\)를 기각할 수 없다.


예를 들어) 계산된 P-value값이 0.024라 할 때, 원하는 유의수준이 0.01이면 기각할 수 없고, 0.05이면 기각할 수 있다.

실제로 많은 통계 프로그램들이 P-value를 output으로 떨군다. 기각역을 일일히 계산하기 보단 P-value 위주로 계산한다.


또한, 계산된 P-value는 \(H_{1}\)을 채택하는 근거의 척도로도 볼 수 있다. P-value가 0.024일 때보다 0.002일 때 더 확실히 \(H_{0}\)를 기각할 수 있다.


위의 예시를 그림으로 그리면 다음과 같다.

유의수준(\(\alpha\)) = 0.05에서 기각역(c) = -1.645 이고, 표본으로부터 계산된 z=-2.22일 때 P-value=0.0132이다.

이 예시에서 P-value = 0.0132는 유의수준 0.05보다 작기때문에 \(H_{0}\)를 기각할 수 있음을 알 수 있다.



반응형