반응형
두 연속형 변수의 요약 : 산점도
지난 포스팅에서 두 범주형 변수의 요약방법인 분할표에 대해 알아보았다.
이번에는 두 연속형 변수의 관계를 알아보기 위한 첫 번째 단계인 산점도에 대해 알아보겠다.
두 연속형 변수 x와 y에 대해 1. 두 변수는 서로 관계가 있는가? 2. 있다면, 어떤 관계인가? 라는 질문을 할 수 있다.
이 때, (x,y)에 대해 그림을 그려 그 관계를 눈으로 파악 할 수 있는데, 이 그림을 산점도라 한다.
산점도란? 변수 x를 수평축에 놓고 변수 y를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시함으로써 얻게되는 그림
이렇게 그린 그림을 관측값들이 직선이나 곡선의 띠를 형성하고 있는지, 또는 특별한 경향 없이 무작위로 흩어져있는지 확인할 수 있다.
예)
1990년도 국가별 국내총생산(GDP) 대비 보건의료비 지출비중과 1인당 보건의료비 지출액수에 대한 산점도를 그려라.
국가 |
GDP대비 보건의료비 지출비중(%) |
1인당 보건비 지출(달러) |
한국 |
6.6 |
365 |
일본 |
6.5 |
1538 |
미국 |
12.7 |
2765 |
프랑스 |
9.4 |
1869 |
독일 |
8.7 |
1511 |
스웨덴 |
8.8 |
2343 |
영국 |
6.1 |
1039 |
대만 |
4.3 |
323 |
싱가폴 |
1.9 |
215 |
홍콩 |
5.7 |
687 |
* 산점도 in R
1 2 3 4 | x <- c(365,1538,2765,1869,1511,2343,1039,323,215,687) y <- c(6.6,6.5,12.7,9.4,8.7,8.8,6.1,4.3,1.9,5.7) plot(x,y, xlab = "보건비 지출", ylab = "지출비중", main = "GDP대비 보건의료비 지출비중과 1인당 보건비 지출에 대한 산점도") | cs |
반응형
'AI > 기초통계' 카테고리의 다른 글
[기초통계] 베르누이 시행이란? (0) | 2019.10.06 |
---|---|
[기초통계] 상관계수란? What is correlation coefficient? (0) | 2019.10.05 |
[기초통계] 분할표란? What is contingency table? (2) | 2019.10.03 |
[기초통계] 상자그림이란? R에서 boxplot 그리기 What is boxplot? (4) | 2019.09.28 |
[기초통계] 백분위수와 사분위수범위, quantile() in R (What is Percentile and Interquartile Range?) (2) | 2019.09.22 |