이전에는 하나의 모집단에 대한 모평균을 추론하는 방법에 대해 알아보았다. 이번에는 하나의 모집단에 관한 것 뿐 아니라 두 모집단 간의 차이를 검정하는 방법에 대해 알아보겠다.
예)
두 종류의 강의방법에 의한 학습효과 비교
기촌의 치료약과 새롭게 개발된 치료약의 효능 비교
두 모집단의 비교
두 모집단의 비교를 위한 추론과정은 자료를 어떻게 수집하느냐에 따라 추론방법이 달라지게 되는데, 대표적인 두 종류의 자료수집과정에 따른 추론방법을 알아보겠다.
1. 실험단위가 독립인 경우
예) 새로 개발된 치료약의 효능이 기존의 약보다 좋음을 검증하기 위해 건강상태가 비슷한 19마리의 쥐를 대상으로 병균을 투입한 후, 그 중에서 임의로 10마리의 쥐를 추출하여 그들에게는 기존의 약을 투약하고, 나머지 쥐들에게는 새로운 약을 투약한다. 그 후 쥐들이 완치될 때까지 걸린 시간을 기록한다.
* 비교하고자 하는 특성을 처리(treatment), 실험의 대상을 실험단위(experimental unit), 실험 후에 얻어지는 수치를 반응값(response)라 한다. 위의 예시에서 기존의 약을 처리1, 새로운 약을 처리2, 각각의 취가 실험단위, 완치될 때까지 걸린 시간이 반응값이다.
2. 실험단위가 독립이 아닌 경우
위 1의 예제에서 쥐 대신 사람을 대상으로 실험한다고 가정하자. 건강상태가 비슷한 사람에게 병균을 투입하는 것은 불가능한 일이기 때문에 이미 병에 걸린 환자를 대상으로 실험해야 한다. 그러나 환자들은 나이, 성별, 건강상태 등이 다르기 때문에 비슷한 조건을 갖는 환자끼리 짝을 짓는다. 즉, 각 쌍 내의 환자들은 서로 빗스한 조건을 갖는 반면, 각 쌍들 간에는 서로 다른 조건들을 갖도록 한다. 이렇게 짝을 지으면 각 쌍의 환자 중 임의로 한 환자에게는 기존의 약을, 다른 한명의 환자에게는 새로운 약을 투약한 후 완치 때까지 걸린 시간을 기록한다.
예제 1의 경우 기존의 약을 투입한 그룹과 새로운 약을 투입한 그룹에서 얻어진 반응값들은 서로 영향을 주지 않고 독립이다. 즉, 두 그룹에서 얻어진 반응값들은 두 개의 모집단으로부터 얻어진 두 개의 독립인 표본자료라 생각할 수 있다. 반면, 예제 2의 경우는 짝 지우는 과정에서 각 쌍에 있는 실험단위들은 비슷한 특성을 갖게 되기 때문에, 서로 독립이라고 할 수 없다. 이와 같은 경우를 짝비교라 한다.
각각의 경우 추론방법은 다음 포스팅에서 알아보도록 하겠다.
'AI > 기초통계' 카테고리의 다른 글
[기초통계] 모평균 비교 :: 독립인 모집단에서 표본의 크기가 작을 때 (1) :: t.test() in R (0) | 2019.11.26 |
---|---|
[기초통계] 모평균 비교 :: 독립인 두 모집단에서 표본의 크기가 클 때 비교 :: R에서 확인하기 :: t.test() in R (0) | 2019.11.25 |
[기초통계] t-distribution :: 표본의 크기가 작을 때 :: n에 따른 t분포 in R (4) | 2019.11.23 |
[기초통계] 유의확률이란? P-value란? (0) | 2019.11.22 |
[기초통계] 기각역이란? :: 제 1종오류와 제 2종오류의 관계 :: 단측검정, 양측검정 (0) | 2019.11.21 |