반응형

AI 86

[기초통계] 유의확률이란? P-value란?

유의확률(P-value)란? 이전에 주어진 유의수준을 갖는 기각역을 구하는 방법을 알아보았다. 표본으로부터 계산된 Z의 값으로부터 그 값이 기각역에 포함되면 \(H_{0}\)를 기각하고, 그렇지 않으면 \(H_{0}\)를 기각하지 않는다. 예를 들어) 유의수준 5%를 갖는 기각역으로 \(R : Z \le -1.645\)를 구하였다고 하자.표본으로부터 Z를 계산하여 z=-1.95로 얻었다면 \(H_{0}\)를 기각할 수 있고, z=-1.42를 얻었다면 \(H_{0}\)를 기각할 수 없다. 이 수치는 기각의 여부 뿐 아니라 얼마나 확실하게 기각할 수 있는가를 판단할 수도 있다.예를 들어 z=-2.22로 얻어졌다면, \(\alpha\)를 0.05에서 0.025로 줄여도 (\(R:Z \le -1.645\) ->..

AI/기초통계 2019.11.22

[기초통계] 기각역이란? :: 제 1종오류와 제 2종오류의 관계 :: 단측검정, 양측검정

앞 서 가설검정과 가설검정시 범할 수 있는 오류에 대해 알아보았다.이번에는 귀무가설을 기각하는 구간인 기각역에 대해 알아보겠다. 기각역이란? 우리는 모집단의 일부분인 표본으로부터 검정의 결론, 즉, \(H_{0}\)을 기각하거나, \(H_{0}\)을 기각하지 않고 유지하는 결정을 내리게 되는데, 이 때 이용되는 표본의 함수, 즉 통계량을 검정통계량이라 한다. 콜레스테롤 수치를 낮춰주기 위해 개발한 신약이 효과가 있는지 없는지 검정하는 예시에서 약 복용 후 실험자들의 콜레스테롤 수치의 평균 \(\bar{X}\)가 검정통계량이 된다. 약을 복용 전 콜레스테롤 수치의 평균이 200이라 하자. \(H_{0}\) : 신약이 효과가 없다. : \(\mu = 200\)\(H_{1}\) : 신약이 효과가 있다. : \..

AI/기초통계 2019.11.21

[기초통계] 가설검정에서 오류란? :: 제 1종오류란? 제 2종오류란? :: 제 1종오류가 제 2종오류보다 중요한 이유

지난시간에 가설검정에 대해 알아보았다. 이번에는 가설검정에서 범할 수 있는 두 가지 오류의 종류에 대해 알아보겠다.>> [기초통계] 가설검정이란? 바로가기https://leedakyeong.tistory.com/entry/%EA%B8%B0%EC%B4%88%ED%86%B5%EA%B3%84-%EA%B0%80%EC%84%A4%EA%B2%80%EC%A0%95%EC%9D%B4%EB%9E%80?category=843401 오류의 종류 가설검정에서 내리는 판단은 다음 두 가지 형태 중 하나로 나타난다.(1) \(H_{0}\)를 기각하고 \(H_{1}\)을 채택한다.(2) \(H_{0}\)를 기각할 수 없으므로 \(H_{0}\)을 유지한다. 위 두 결론은 모집단의 일부분인 표본으로부터 판단되어 내려지기 때문에 잘못된 ..

AI/기초통계 2019.11.14

[기초통계] 가설검정이란?

기초통계 :: 가설검정이란?가설검정이란? 모수에 대한 가설이 적합한지를 추출한 표본으로부터 판단하고자 하는 것 1. 가설검정이 필요한 이유/ 가설검정 예시 모 병원에서 콜레스테롤 수치를 낮춰주는 신약을 개발했다. 이 약이 정말 효과가 있는지 어떻게 알아보아야 할까? 실험 대상이 되는 성인 40명을 대상으로 약 복용 전 콜레스테롤 수치를 측정하여 평균\(\bar{X}\)을 계산하였다. 그 수치는 평균 200(mg/dl) 이고 표준편차는 24(mg/dl) 인 분포를 따른다고 하자. 약 복용 후 콜레스테롤 수치를 \(\mu\)라 하자. 직관적으로 생각했을 때 이 모평균 \(\mu\)를 알기 위해서는 실험 대상(표본) 뿐 아니라 모든 사람에 대해 측정해야 한다. 하지만 이는 불가능에 가깝기 때문에 표본에 대해서..

AI/기초통계 2019.11.13

[시계열 자료 분석] R에서 AirPassengers 데이터 선형계절추세모형 적합시키기

R에서 AirPassengers 데이터 선형계절추세모형(linear and seasonal trend model)에 적합시키는 방법 AirPassengers 데이터는 ts 타입의 데이터로, 1949년부터 1960년까지 매 월 한 포인트의 데이터를 가지고 있다. > AirPassengers Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec1949 112 118 132 129 121 135 148 148 136 119 104 1181950 115 126 141 135 125 149 170 170 158 133 114 1401951 145 150 178 163 172 178 199 199 184 162 146 1661952 171 180 193 181 183 218 230 ..

[R] stl() 이란? :: stl parameter :: stl s.window

R에서 시계열 데이터 분해하는 방법 time series 데이터를 체계적 성분으로 분해하는 함수 중 하나가 stl() 이다. stl(x, s.window, s.degree = 0, t.window = NULL, t.degree = 1, l.window = nextodd(period), l.degree = t.degree, s.jump = ceiling(s.window/10), t.jump = ceiling(t.window/10), l.jump = ceiling(l.window/10), robust = FALSE, inner = if(robust) 1 else 2, outer = if(robust) 15 else 0, na.action = na.fail) stl() 함수에 input으로 들어가는 데이터의 ..

[기초통계] 통계적 추론방법 :: 구간추정(Interval Estimation), 신뢰구간이란? 신뢰수준의 의미, 해석

이전 포스팅에서 통계적 추론 방법 중 점추정에 대해 알아보았다. >> 통계적 추론 방법 :: 점추정 바로가기 이번에는 구간추정에 대해 알아보겠다. (2) 구간추정 (Interval Estimation) 점추정은 말 그대로 모수를 하나의 수치로 추정하고자 하는 것이다. 반면 구간추정은 하나의 수치를 구하는 것이 아니라, 추정량의 분포를 이용하여 표본으로부터 모수 값을 포함하리라고 예상되는 구간을 제시하는 것이다. 이 때 제시되는 구간을 신뢰구간(confidence interval)이라 부른다. 신뢰구간은 대개 (L, U)의 형태로 이루어지며, L과 U는 표본으로부터 계산된다. 즉, 매 표본마다 계산되는 신뢰구간이 서로 다를 수 있다. 만약 어떤 모평균에 대한 신뢰구간으로 (-∞, ∞)가 주어진다면, 어떤 ..

AI/기초통계 2019.10.29

[기초통계] 통계적 추론방법 :: 점추정(Point Estimation)

통계적 추론이란? 통계적 추론이란 추출된 표본으로부터 모집단의 일반적인 특성을 추론해내는 것을 뜻한다.표본이 추출되면 평균, 분산, 표준편차 등 표본에 대한 정보를 얻을 수 있다. 그러나 궁금한 것은 단 하나의 표본에 대한 정보가 아니라 모집단의 일반적인 특성이다. 예를 들어, 100명의 유권자를 대상으로 후보 A에 대한 지지여부를 조사했더니 60명이 지지했다고 하자. 이 때 관심사는 이 100명의 지지율이 아니라 전체 유권자의 지지율이 될 것이다. 단, 전체 유권자를 대상으로 조사하지 않는 한 전체 유권자의 지지율을 구할 수 없으므로, 표본이 가지고 있는 정보를 이용하여 이를 추측하게 되는데 이와 같은 과정이 통계적 추론의 한 과정이라고 할 수 있다. 통계적 추론이란? 표본이 갖고 있는 정보를 분석하여..

AI/기초통계 2019.10.23

표본평균의 분포 & 중심극한정리 in R

표본평균의 분포 모평균에 대한 추론은 표본의 평균 X̄와 그 분포를 이용한다.평균이 μ이고 분산이 σ^2인 모집단으로부터 크기가 n인 표본 X1, X2, ..., Xn을 추출했을 때, 표본평균 X̄의 기댓값과 분산은 다음과 같다. 표본평균 분포의 중심은 모집단의 중심 μ와 일치한다. 그러나 표집분포의 퍼짐 정도를 측정하는 표준편차는 표본의 크기에도 영향을 받는다. 즉, 표본의 크기 n이 증가함에 따라 표본평균의 표준편차는 n의 제곱근에 반비례해서 감소하는데 이는 표본평균의 분포가 μ를 중심으로 더욱 집중됨을 나타낸다. 예를 들어, 표본의 크기를 100배 늘리면, 표본평균의 표준편차는 1/10으로 감소하여 표집분포가 μ를 중심으로 더욱 집중된다. 중심극한정리란? 모집단의 분포가 정규분포가 아닌 경우 X̄의..

AI/기초통계 2019.10.19

표집분포란? What is sampling distribution?

표집분포란? What is sampling distribution? 주어진 표본으로부터 모집단의 성격을 알아내고자 하는 추론이 바로 통계학에서 가장 핵심적인 부분이다.우리는 모집단의 특성 중 어떠한 수치, 예를 들면, 모평균이나 모비율 또는 무표준편차 등에 관심이 있는 경우가 만흔데, 이러한 특성값을 모수라 하며 통계학에서 추론의 실제 대상이 된다. 모수란? 수치로 표현되는 모집단의 특성 모수의 참값은 미지의 상수로, 이를 알아내려면 모집단 전체를 다 조사해야만 한다. 그러나 이는 불가능한 경우가 많기 때문에 sampling된 표본으로 모수를 추론한다. 예를들어, 대한민국 전체 남자 키 평균을 알고싶다고 하자. 이 때, 모수는 대한민국 전체 남자 키 평균이며, 모집단은 대한민국 전체 남자가 된다. 이를 ..

AI/기초통계 2019.10.17
반응형