반응형

r 24

[R] XIA(eXplainable AI) 패키지 중 DALEX로 변수 중요도 뽑기(classification)

지난 포스팅에서 XAI와 DALEX 패키지에 대해 간단히 소개하고, Regression 문제에서 DALEX 패키지로 변수 중요도 뽑는 방법과 그 원리를 알아보았다. 2021.11.15 - [AI/잡지식] - [R] XIA(eXplainable AI) 패키지 중 DALEX로 변수 중요도 뽑기 [R] XIA(eXplainable AI) 패키지 중 DALEX로 변수 중요도 뽑기 DALEX :: Variable Importance Measures in R Deep Learning 모델을 Black Box 라 부르곤 한다. 설명이 가능한 Linear Regression과 같은 모델과 달리 layer가 많고 weight가 많아 모델에 대한 설명이 어렵기 때문.. leedakyeong.tistory.com 이번에는 ..

AI/잡지식 2021.11.15 (2)

[R] XIA(eXplainable AI) 패키지 중 DALEX로 변수 중요도 뽑기

DALEX :: Variable Importance Measures in R Deep Learning 모델을 Black Box 라 부르곤 한다. 설명이 가능한 Linear Regression과 같은 모델과 달리 layer가 많고 weight가 많아 모델에 대한 설명이 어렵기 때문이다. 이런 Black Box 모델들을 설명하고자 하는 needs가 꾸준히 있어왔고, 이를 XAI 혹은 eXplainable AI라 부른다. R과 Python에서 이런 XAI가 가능한 패키지들을 몇가지 제공하고 있는데, 다음과 같다. 이 중 R에서 DALEX 패키지를 활용해서 Regression 문제와 Classification 문제를 나누어 변수 중요도 뽑는 방법을 소개하고자 한다. Regression과 Classificatio..

AI/잡지식 2021.11.15

[R Markdown] Markdown, DT datatable, dygraph 기본 옵션

(나를 위한) 평소 고정으로 사용하는 마크다운 옵션들 정리 1. Markdown --- title: "[Title]" author: "by SK C&C 이다경 선임 - 2021/04/29" output: rmdformats::readthedown: code_folding: hide number_sections: TRUE toc_depth: 4 --- > Description ```{r setup, include=FALSE} knitr::opts_chunk$set(echo=TRUE, warning=FALSE, message=FALSE, results = 'asis') options(warn = F, scipen = 100, digits = 3) # Library library(tidyverse) libra..

R/MarkDown 2021.04.29

[R Markdown] DT datatable in for loop showing white space after render to html

2020.07.31 - [R/MarkDown] - [R Markdown] for loop로 chunk 여러개 만들기 2020.12.22 - [R/MarkDown] - [R Markdown] DT datatable 커스터마이징 :: 파라미터 알아보기 DT 패키지의 datatable을 Rmarkdown에서 for loop로 찍어낼 때, 다음과 같이 보여주고자 하는 데이터 개수에 따라 다음 테이블과 거리가 너무 멀거나, 너무 가까워 겹치는 경우가 발생하기도 한다. for (i in c(1,5,10)) { print(htmltools::tagList(DT::datatable(cars[1:i,]))) cat("\n\n \n\n") } 첫 번째 테이블은 1개 row만 보여줄 때, 아래 테이블은 5개 row만 보여줄..

R/MarkDown 2021.04.29 (2)

[R Markdown] DT datatable 커스터마이징 :: 파라미터 알아보기

R 마크다운 DT::datatable 파라미터 조정하기 R 에서 만든 마크다운 파일(html) 파일에 DT 라이브러리에 datatable 함수로 data를 보기 좋게 표현할 수 있다. 예로 iris 데이터를 DT::datatable 로 표현하면 다음과 같다. 코드는 다음과 같다. datatable(DATA) 로 쉽게 표현할 수 있다. ```{r setup, include=FALSE} knitr::opts_chunk$set(echo=TRUE, warning=FALSE, message=FALSE, results = 'asis') options(warn = F) library(DT) ``` ```{r} datatable(iris) ``` 참고로 datatable parameter의 default 값은 다음과 ..

R/MarkDown 2020.12.22

[R] caret 패키지로 modeling & model tuning (iris classification :: knn algorithm)

이전에 caret 패키지로 Data Scaling 하는 방법을 알아보았다. 2020/09/03 - [R] - [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 Data Scaling in R 데이터 scale 이란 전처리 과정 중 하나로, 각 컬럼의 분포를 맞춰주기 위해 필요한 과정이다. scale 과정 없이 모델링을 한다고 했을 때 문제점은 예를 들어, X1의 범위는 0~1 이고, X2의 leedakyeong.tistory.com 이번에는 caret 패키지를 이용하여 모델을 만들고..

R 2020.09.16

[R] GA 특정 값으로 최적화 하는 방법 (no Maximizing) :: How to optimize with GA specific values in R

R에서 GA 최대값으로 최적화 하지 않고, 지정된 값으로 최적화 하는 방법 Genetic Algorithm(GA - 유전 알고리즘) 최적화 문제를 해결하는 기법 중 하나로, 생물의 진화를 모방한 방법이다. R에서는 GA 패키지로 제공되고 있으며, 기본적으로 주어진 fitness function을 최대화 하는 방향으로 최적화 한다. (function에 -(minus)를 붙여주면 최솟값으로 최적화 할 수도 있다. 자세한 방법은 아래 실습에서 다루겠다.) 1. Maximizing 우선, 주어진 function을 최대화 하는 기본적인 코드는 다음과 같다. 주어진 function은 다음과 같고, 찾고자 하는 x의 범위는 -10 ~ 10라 하자. $$ function : (x^2+x)*cos(x) $$ 해당 fun..

R 2020.09.14 (2)
반응형