기초통계 - 이항분포와 관련있는 베르누이
두 그룹으로 나누어져 있는 모집안에서 표본을 추출하는 경우, 각 단계의 추출은 두 가지의 결론만을 갖게된다. 동전던지기가 그 예이다. 동전을 던졌을 때 그 결과는 앞면, 뒷면으로 두 가지만 나타난다.
이런 경우 매번 반복되는 추출(실험)을 통계학용어로 시행(trial)이라 부르고, 두 개의 가능한 결과 중 하나는 성공(S, success), 다른 하나는 실패(F, failure)라 부르는데, 이는 시행 결과가 두 개뿐임을 의미하며 진짜 성공과 실패와는 부관하다. 보통 관심있는 결과를 성공이라 부른다.
이 '성공'과 '실패'로 나타나는 시행이 반복되면서 다음과 같은 조건이 만족되는 경우 이를 베르누이 시행이라 부른다.
베르누이 시행(Bernoulli trial)
(1) 각 시행은 성공(S), 실패(F)의 두 결과만을 갖는다.
(2) 각 시행에서 성공할 확률은 P(S) = p, 실패할 확률은 P(F) = q(=1-p)로 그 값이 일정하다.
(3) 각 시행은 서로 독립으로, 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않는다.
예를 들어, 동전던지기에서 앞면과 뒷면이 나오는 경우는 각각 독립이며, p=q=1/2로 일정하다.
복원추출 VS 비복원추출
복원추출과 비복원추출은 베르누이 실행일까?
1. 복원추출 : 베르누이 시행 O
15개의 상품으로 이루어진 모집단에서 5개는 불량품이라고 하자. 하나씩 상품을 추출해서 그것의 불량여부를 기록한 후에 다시 집어넣고 다시 추출을 반복한다. 이 때 각 추출의 결과는 정상품(F)이거나 불량품(S)이고 각 추출마다 성공할 확률을 p = P(S) = 5/15 = 1/3로 일정하다. 또한 매 추출은 서로 영향을 주지 않고 독립이므로 이런 경우의 반복되는 추출은 베르누이 시행을 따른다고 할 수 있다.
2. 비복원추출 : 베르누이 시행 X
비복원추출의 경우 두 번째 추출의 결과는 첫 번째 추출의 결과에 영향을 받게된다. 따라서 베르누이 시행의 3번조건인 독립성을 만족하지 못한다. 다만, 모집단의 크기가 표본의 크기에 비해 상당히 크다면 독립성 위반은 아주 미약해진다.
'AI > 기초통계' 카테고리의 다른 글
[기초통계] 정규확률그림이란? 정규확률그림 그리는 방법/원리 (qqplot in R) (0) | 2019.10.08 |
---|---|
[기초통계] 이항분포란? What is binomial distribution? (0) | 2019.10.07 |
[기초통계] 상관계수란? What is correlation coefficient? (0) | 2019.10.05 |
[기초통계] 산점도란? What is scatter plot? (0) | 2019.10.04 |
[기초통계] 분할표란? What is contingency table? (2) | 2019.10.03 |