AI/기초통계

[기초통계] 범주형 자료 표현하는 방법 (categorical data)

슈퍼짱짱 2019. 8. 29. 08:00
반응형

>> 통계학이란? 바로가기

>> 모집단 VS 표본집단 바로가기

>> 수치형자료와 범주형자료 바로가기



범주형 자료의 요약


이전 포스팅에서 수치형 자료의 범주형 자료의 정의  및 예시에 대해 알아보았다.

이번에는 범주형 자료를 어떻게 표현하는지에 대해 알아보겠다.


범주형 자료에서는 각 관측값의 크기가 아니라 자료가 갖는 범주의 종류에 관심이 있으므로,

각 범주가 나타나는 횟수를 요약함으로써 범주형 자료의 개요를 파악할 수 있다.




1. 도수분포표(Frequency Table)


범주형 자료의 경우 각 관측값은 몇 개의 범주 중 하나의 값을 갖게 된다.


도수(frequency)란? 각 범주에 속하는 관측값의 개수를 그 범주에 도수라 한다.


상대도수(relative frequency)란? 도수를 전체 개수로 나눈 비율을 그 범주의 상대도수라 한다.


도수분포표(frequency table)란? 범주형 자료에서 범주와 그 범주에 대응하는 도수와 상대도수를 나열하여 표를 작성한 것을 말한다.


예)

한 회사에서 새로 개발한 자동차의 외형에 대하여 고객 150명을 임의로 뽑아 선호도를 조사하였다.

150명 중에서 71명은 좋다고 답하고, 42명은 그저 그렇다고 하고, 28명은 싫다고 하고, 9명은 답을 하지 않았다.

조사에 대한 도수분포표를 작성하라.


답 

도수 

상대도수 

좋다 

71 

0.473 (=71/150) 

 그저 그렇다

28 

0.280 

싫다 

28 

0.187 

무응답 

0.060 

합 

150 

1.000 



>> 도수분포표 in R 바로가기




2. 원형그래프(파이차트 Pie Cart)


원형그래프란? 먼저 원을 그리고 이 원을 상대도수에 비례하여 중심각을 나누어 마치 파이의 조각을 나눈 것과 같은 형태를 갖도록 하는 그림이다.


위의 예시에 대한 Pie Chart는 다음과 같다.

>> 파이차트 in R 바로가기




3. 막대그래프 (Bar Chart)


막대그래프는 각 범주에서 도수의 크기를 막대로 그려 나타낸다.


막대그래프를 이용하면 각 범주간의 도수를 비교하는데 용이하다.

그러나 각 범주 또는 몇 개의 범주가 전체에서 차지하는 비율을 파악하려면 원형그래프가 적당하다.


위의 예시에 대한 Bar Chart는 다음과 같다.



>> 막대그래프 in R 바로가기









반응형