R

[R] 도수분포표란? (frequency table in R)

슈퍼짱짱 2019. 8. 30. 08:00
반응형

도수분포표 in R


지난 포스팅에서 범주형 자료를 표현하는 방법에 대해 알아보았다.

이번에는 그 중에서도 도수분포표에 대해 R 코드로 알아보겠다.


>> 범주형 자료 표현하는 방법 바로가기




1. 도수분포표란?


범주형 자료의 경우 각 관측값은 몇 개의 범주 중 하나의 값을 갖게 된다.


도수(frequency)란? 각 범주에 속하는 관측값의 개수를 그 범주에 도수라 한다.


상대도수(relative frequency)란? 도수를 전체 개수로 나눈 비율을 그 범주의 상대도수라 한다.


도수분포표(frequency table)란? 범주형 자료에서 범주와 그 범주에 대응하는 도수와 상대도수를 나열하여 표를 작성한 것을 말한다.


예)

한 회사에서 새로 개발한 자동차의 외형에 대하여 고객 150명을 임의로 뽑아 선호도를 조사하였다.

150명 중에서 71명은 좋다고 답하고, 42명은 그저 그렇다고 하고, 28명은 싫다고 하고, 9명은 답을 하지 않았다.

조사에 대한 도수분포표를 작성하라.


답 

도수 

상대도수 

좋다 

71 

0.473 (=71/150) 

 그저 그렇다

42 

0.280 

싫다 

28 

0.187 

무응답 

0.060 

합 

150 

1.000 




2. Frequency table in R


위 예제이 있는 테이블을 R에서 구현하면 다음과 같다.


1
2
3
data <- data.frame("답"=c("좋다","그저 그렇다","싫다","무응답","합"),
                   "도수"=c(71,42,28,9,150))
data$'상대도수'<-round(data$도수/150,3)
cs


> data


           답 도수 상대도수

1        좋다   71    0.473

2 그저 그렇다   42    0.280

3        싫다   28    0.187

4      무응답    9    0.060

5          합  150    1.000



반응형