AI/기초통계

[기초통계] 산점도란? What is scatter plot?

슈퍼짱짱 2019. 10. 4. 08:00
반응형

두 연속형 변수의 요약 : 산점도


지난 포스팅에서 두 범주형 변수의 요약방법인 분할표에 대해 알아보았다.

이번에는 두 연속형 변수의 관계를 알아보기 위한 첫 번째 단계인 산점도에 대해 알아보겠다.


두 연속형 변수 x와 y에 대해 1. 두 변수는 서로 관계가 있는가? 2. 있다면, 어떤 관계인가? 라는 질문을 할 수 있다.

이 때, (x,y)에 대해 그림을 그려 그 관계를 눈으로 파악 할 수 있는데, 이 그림을 산점도라 한다.


산점도란? 변수 x를 수평축에 놓고 변수 y를 수직축에 놓은 후에 각 관측값의 짝을 좌표 위에 표시함으로써 얻게되는 그림


이렇게 그린 그림을 관측값들이 직선이나 곡선의 띠를 형성하고 있는지, 또는 특별한 경향 없이 무작위로 흩어져있는지 확인할 수 있다.


예)

1990년도 국가별 국내총생산(GDP) 대비 보건의료비 지출비중과 1인당 보건의료비 지출액수에 대한 산점도를 그려라.


 국가 

GDP대비 보건의료비 지출비중(%)

1인당 보건비 지출(달러) 

한국 

6.6 

365 

일본 

6.5 

1538 

미국 

12.7 

2765 

프랑스 

9.4 

1869 

독일 

8.7 

1511 

스웨덴 

8.8 

2343 

영국 

6.1 

1039 

대만 

4.3 

323 

싱가폴 

1.9 

215 

홍콩 

5.7 

687 


* 산점도 in R

1
2
3
4
x <- c(365,1538,2765,1869,1511,2343,1039,323,215,687)
y <- c(6.6,6.5,12.7,9.4,8.7,8.8,6.1,4.3,1.9,5.7)
 
plot(x,y, xlab = "보건비 지출", ylab = "지출비중", main = "GDP대비 보건의료비 지출비중과 1인당 보건비 지출에 대한 산점도")
cs



반응형