반응형

r 26

[R] caret 패키지로 modeling & model tuning (iris classification :: knn algorithm)

이전에 caret 패키지로 Data Scaling 하는 방법을 알아보았다. 2020/09/03 - [R] - [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 Data Scaling in R 데이터 scale 이란 전처리 과정 중 하나로, 각 컬럼의 분포를 맞춰주기 위해 필요한 과정이다. scale 과정 없이 모델링을 한다고 했을 때 문제점은 예를 들어, X1의 범위는 0~1 이고, X2의 leedakyeong.tistory.com 이번에는 caret 패키지를 이용하여 모델을 만들고..

R 2020.09.16

[R] GA 특정 값으로 최적화 하는 방법 (no Maximizing) :: How to optimize with GA specific values in R

R에서 GA 최대값으로 최적화 하지 않고, 지정된 값으로 최적화 하는 방법 Genetic Algorithm(GA - 유전 알고리즘) 최적화 문제를 해결하는 기법 중 하나로, 생물의 진화를 모방한 방법이다. R에서는 GA 패키지로 제공되고 있으며, 기본적으로 주어진 fitness function을 최대화 하는 방향으로 최적화 한다. (function에 -(minus)를 붙여주면 최솟값으로 최적화 할 수도 있다. 자세한 방법은 아래 실습에서 다루겠다.) 1. Maximizing 우선, 주어진 function을 최대화 하는 기본적인 코드는 다음과 같다. 주어진 function은 다음과 같고, 찾고자 하는 x의 범위는 -10 ~ 10라 하자. $$ function : (x^2+x)*cos(x) $$ 해당 fun..

AI/Optimization 2020.09.14

윈도우 작업 스케줄러에 R script 등록하기

작업 스케줄러로 R script 자동 실행하기 :: R script로 윈도우 작업 스케줄러 등록하기 자동으로 매일 혹은 매 시간마다 R script를 실행시켜야 할 때가 있다.그럴 때 윈도우 작업 스케줄러를 활용한다. 시작 버튼 눌러 작업 스케줄러 검색하고 직접 적용시키는 방법도 있지만, 경로 설정 등의 헷갈리는 부분이 있어서 R script 에서 직접 적용시키는 방법을 소개하고자 한다. 1. 실행하고자 하는 R script를 작성한다. 12345png(paste0("PATH",format(Sys.time(), format = "%Y_%m_%d %H_%M_%S"),".png"))plot(x=1,y=1)dev.off() print(Sys.time())Colored by Color Scriptercs 현재 ..

R 2020.03.05

[R Markdown] toc customizing :: R 마크다운 목차 커스터마이징

[R Markdown] 목차(TOC) 커스터마이징 R Markdown 에서 목차를 추가하는 방법은 간단하다. ---title: "[R Markdown] TOC customizing"output: html_document : toc : true--- .Rmd 파일 맨 위 output format에서 toc : true 를 추가해주면 된다. 예) 1234567891011121314151617181920212223242526272829303132---title: "[R Markdown] TOC customizing"output: html_document : toc : true--- # First toc*** ```{r}ex

R/MarkDown 2019.12.23

[기초통계] 모평균 비교 :: 독립인 모집단에서 표본의 크기가 작을 때 (1) :: t.test() in R

이전에 독립인 두 모집단에서 표본의 크기가 클 때 모평균 비교 검정하는 방법에 대해 알아보았다. 이번에는 표본의 크기가 작을 때 모평균 비교 검정하는 방법을 알아보겠다. >> 독립인 두 모집단에서 표본의 크기가 클 때 바로가기 독립인 두 모집단에서 표본의 크기가 작을 때 모평균의 차 (\(\mu_{1} - \mu_{2}\)) 비교 표본의 크기가 작을 때는 일반적으로 두 모집단에 대하여 정규분포 가정이 필요하다. 또 다른 가정은 ① 두 모집단의 표준편차가 같다고 가정하는 경우와 ② 두 모집단의 표준편차가 다르다고 가정하는 경우이다. 1. 두 모집단의 표준편차가 같다고 가정하는 경우 두 모집단의 표준편차가 같은지(\(\sigma_{1} = \sigma_{2}\)) 판단하기 위해 표본표준편차를 이용한다. 두 ..

AI/기초통계 2019.11.26

[시계열 자료 분석] R에서 AirPassengers 데이터 선형계절추세모형 적합시키기

R에서 AirPassengers 데이터 선형계절추세모형(linear and seasonal trend model)에 적합시키는 방법 AirPassengers 데이터는 ts 타입의 데이터로, 1949년부터 1960년까지 매 월 한 포인트의 데이터를 가지고 있다. > AirPassengers Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec1949 112 118 132 129 121 135 148 148 136 119 104 1181950 115 126 141 135 125 149 170 170 158 133 114 1401951 145 150 178 163 172 178 199 199 184 162 146 1661952 171 180 193 181 183 218 230 ..

[기초통계] 정규확률그림이란? 정규확률그림 그리는 방법/원리 (qqplot in R)

정규확률그림이란? What is Q-Q plot? 많은 경우에 통계적인 절차나 분석 등에서 모집단의 분포가 정규분포를 따른 다는 가정을 하고 있다. 그렇다면 표본을 추출했을 때 이러한 정규모집단의 가정을 조사하는 방법은 어떤 것이 있을까? 그 방법 중 하나가 바로 정규확률그림으로 확인하는 것이다.정규점수그림(normal scores plot) 또는 정규확률그림(normal probability plot)이라 하는데 정규확률그림이라는 용어를 더 많이 쓴다. 이 때, 정규점수(normal scores)란 표준정규분포(mean=0,sd=1)에서의 이상적인 표본을 말한다. 즉, 표준정규분포의 확률밀도함수를 등확률 구간으로 나누어 주는 경계값(z값)을 의미한다. 분위수를 생각해보면 쉽다. n분위수에 해당하는 z값..

AI/기초통계 2019.10.08

[기초통계] 상자그림이란? R에서 boxplot 그리기 What is boxplot?

앞서 리뷰했던 중심의 위치, 퍼진 정도 등의 수치들은 자료의 여러 성질을 나타내지만, 자료 전체의 대략적인 모양을 보여 주지는 못하는 단점이 있다. >> 평균 vs 중앙값 vs 최빈값 바로가기>> 분산 & 표준편차란? 바로가기 >> 백분위수 & 사분위수란? 바로가기 이에 이번 포스팅에서는 상자그림에 대해 알아보고 R에서 직접 구현하는 방법도 알아보겠다. 상자그림이란? 상자그림(boxplot)이란? 자료로부터 얻는 다섯 가지 요약수치인 최소값, Q1, Q2, Q3, 최대값을 가지고 그림을 그린것이다. box plot을 그리는 자세한 과정은 다음과 같다. 1. 사분위수(Q1, Q2, Q3)를 결정한다. 2. Q1과 Q3을 네모난 상자로 연결하고, 중앙값(Q2)의 위치에 수직선을 긋는다.3. IQR = Q3 ..

AI/기초통계 2019.09.28

[R] R에서 eval() 함수로 표현식 실행하기 (eval in R)

R에서 eval() 함수로 character expression 실행하기(execute r-code stored in a string variable) for문을 통해 반복하면서 특정 문자만 바꾸어 무언가를 실행하고 싶은 경우가 있다.예를 들면, 회귀분석에서 들어가는 feature를 바꾼다던가, 데이터의 모든 컬럼에 대해 그래프를 그릴때 등이다.그 때, eval 함수를 이용할 수 있다. 다음은 eval 함수 예제코드이다. 12a class(a)"character" > b10 > class(b)"numeric" 이는 for문에서 다음과 같이 활용될 수 있다.5개의 컬럼을 가진 데이터의 각 컬럼에 대해 ggplot으로 그림을 그려본다고 가정하자. 코드는 다음과 같다. 12345678910library(ggp..

R 2019.09.18

[R] R에서 문자열 합치기 or list의 모든 element 하나로 합치기 (paste in R)

R에서 문자열 or list 한 문자열로 합치기 (Convert list into a string in R)(Concatenate vectors after converting to character in R) R에서 특정 문자열을 하나로 합치고 싶을 때가 있다. 이때 paste or paste0 함수를 사용하면 된다.paste에는 두 가지 형태의 함수가 있다. paste (..., sep = " ", collapse = NULL)paste0(..., collapse = NULL) paste는 나열된 원소 사이에 공백을 기본으로 두고 출력하며, paste0는 공백없이 출력한다.이때, sep 및 collapse는 각 원소 사이를 구분하는 파라미터이다. 자세한 예제는 아래서 설명하겠다. 1. 묶여있는 원소 하..

R 2019.09.17
반응형