[기초통계] 유의확률이란? P-value란?

AI/기초통계

[기초통계] 유의확률이란? P-value란?

슈퍼짱짱 2019. 11. 22. 10:00

유의확률(P-value)란?

이전에 주어진 유의수준을 갖는 기각역을 구하는 방법을 알아보았다.

표본으로부터 계산된 Z의 값으로부터 그 값이 기각역에 포함되면 $H_{0}$ 를 기각하고, 그렇지 않으면 $H_{0}$ 를 기각하지 않는다.

예를 들어) 유의수준 5%를 갖는 기각역으로 $R : Z \le -1.645$ 를 구하였다고 하자.

표본으로부터 Z를 계산하여 z=-1.95로 얻었다면 $H_{0}$ 를 기각할 수 있고, z=-1.42를 얻었다면 $H_{0}$ 를 기각할 수 없다.

이 수치는 기각의 여부 뿐 아니라 얼마나 확실하게 기각할 수 있는가를 판단할 수도 있다.

예를 들어 z=-2.22로 얻어졌다면, $\alpha$ 를 0.05에서 0.025로 줄여도 ( $R:Z \le -1.645$ -> $R:Z \le -1.96$ ) 여전히 $H_{0}$ 를 기각할 수 있다.

즉, 얻어진 Z의 값으로부터 $H_{0}$ 를 기각할 수 있게 하는 최소의 유의수준이 작을수록 더욱 확실하게 $H_{0}$ 를 기각하게( $H_{1}$ 을 채택하게) 된다.

그렇다면, 얻어진 Z의 값을 가지고 기각할 수 있게 하는 최소의 유의수준은 어떻게 구할 수 있을까?

예를 들어) 콜레스테롤 수치를 낮춰주기 위해 신약을 개발했다고 하자. 이 약이 효과가 있는지, 없는지 검증하는 과정에서 z=-2.22의 값이 얻어졌다고 하자. 이 때 이 값으로 $H_{0}$ 를 기각하기 위한 최소의 유의수준은 $P(Z \le -2.22)=0.0132$ 이다. 즉, 이 예시에서 표본으로부터 관측된 Z값으로 $H_{0}$ 를 기각할 수 있는 최소의 유의수준은 0.0132이며, 이를 P-값(P-value) 혹은 유의확률(significance probability)라 한다.

P-value란? 주어진 검정통계량의 관측치로부터 $H_{0}$ 를 기각하게 하는 최소의 유의수준

* Z=z일 때 각 기각역의 형태에 따라 P-value 구하는 방법

$R : Z \le d \quad P-value=P(Z \le z)$

$R : Z \ge d \quad P-value=P(Z \ge z)$

$R : \left|Z \right| \le d \quad P-value=P(\left|Z \right| \le z)$

이에 따라, 계산된 P-value값이 원하는 유의수준보다 작으면 $H_{0}$ 를 기각할 수 있고, 유의수준보다 크면 $H_{0}$ 를 기각할 수 없다.

예를 들어) 계산된 P-value값이 0.024라 할 때, 원하는 유의수준이 0.01이면 기각할 수 없고, 0.05이면 기각할 수 있다.

실제로 많은 통계 프로그램들이 P-value를 output으로 떨군다. 기각역을 일일히 계산하기 보단 P-value 위주로 계산한다.

또한, 계산된 P-value는 $H_{1}$ 을 채택하는 근거의 척도로도 볼 수 있다. P-value가 0.024일 때보다 0.002일 때 더 확실히 $H_{0}$ 를 기각할 수 있다.

위의 예시를 그림으로 그리면 다음과 같다.

유의수준( $\alpha$ ) = 0.05에서 기각역(c) = -1.645 이고, 표본으로부터 계산된 z=-2.22일 때 P-value=0.0132이다.

이 예시에서 P-value = 0.0132는 유의수준 0.05보다 작기때문에 $H_{0}$ 를 기각할 수 있음을 알 수 있다.

저작자표시

'AI > 기초통계' 카테고리의 다른 글

[기초통계] 모평균 비교 :: 두 모집단이 독립일때와 독립이 아닐 때 (0)	2019.11.24
[기초통계] t-distribution :: 표본의 크기가 작을 때 :: n에 따른 t분포 in R (4)	2019.11.23
[기초통계] 기각역이란? :: 제 1종오류와 제 2종오류의 관계 :: 단측검정, 양측검정 (0)	2019.11.21
[기초통계] 가설검정에서 오류란? :: 제 1종오류란? 제 2종오류란? :: 제 1종오류가 제 2종오류보다 중요한 이유 (0)	2019.11.14
[기초통계] 가설검정이란? (2)	2019.11.13

현재글[기초통계] 유의확률이란? P-value란?

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

슈퍼짱짱