반응형

visualization 3

[기초통계] 상자그림이란? R에서 boxplot 그리기 What is boxplot?

앞서 리뷰했던 중심의 위치, 퍼진 정도 등의 수치들은 자료의 여러 성질을 나타내지만, 자료 전체의 대략적인 모양을 보여 주지는 못하는 단점이 있다. >> 평균 vs 중앙값 vs 최빈값 바로가기>> 분산 & 표준편차란? 바로가기 >> 백분위수 & 사분위수란? 바로가기 이에 이번 포스팅에서는 상자그림에 대해 알아보고 R에서 직접 구현하는 방법도 알아보겠다. 상자그림이란? 상자그림(boxplot)이란? 자료로부터 얻는 다섯 가지 요약수치인 최소값, Q1, Q2, Q3, 최대값을 가지고 그림을 그린것이다. box plot을 그리는 자세한 과정은 다음과 같다. 1. 사분위수(Q1, Q2, Q3)를 결정한다. 2. Q1과 Q3을 네모난 상자로 연결하고, 중앙값(Q2)의 위치에 수직선을 긋는다.3. IQR = Q3 ..

AI/기초통계 2019.09.28

[R] R에서 eval() 함수로 표현식 실행하기 (eval in R)

R에서 eval() 함수로 character expression 실행하기(execute r-code stored in a string variable) for문을 통해 반복하면서 특정 문자만 바꾸어 무언가를 실행하고 싶은 경우가 있다.예를 들면, 회귀분석에서 들어가는 feature를 바꾼다던가, 데이터의 모든 컬럼에 대해 그래프를 그릴때 등이다.그 때, eval 함수를 이용할 수 있다. 다음은 eval 함수 예제코드이다. 12a class(a)"character" > b10 > class(b)"numeric" 이는 for문에서 다음과 같이 활용될 수 있다.5개의 컬럼을 가진 데이터의 각 컬럼에 대해 ggplot으로 그림을 그려본다고 가정하자. 코드는 다음과 같다. 12345678910library(ggp..

R 2019.09.18

[R] 수평선, 수직선 in ggplot (add horizontal line, vertical line in ggplot2)

ggplot으로 수평선, 수직선 추가하는 방법 in R ggplot에서 수평선과 수직선은geom_hline() 및 geom_vline()으로 표현할 수 있다. 1. loading "ggplot2" package 1library(ggplot2)cs 2. 수평선 추가* 수평선은 yintercept로 원하는 위치를 지정할 수 있다. 12ggplot() + geom_hline(yintercept = 1:30)cs 3. 수직선 추가* 수직선은 xintercept로 원하는 위치를 지정할 수 있다. 12ggplot() + geom_vline(xintercept = 1:30)cs 4. 수평선 + 수직선 추가 123ggplot() + geom_hline(yintercept = 1:30) + geom_vline(xinte..

R 2019.09.05
반응형