반응형

분류 전체보기 241

의사결정나무(Decision Tree) :: 독립변수가 연속형 일 때

2020/04/21 - [통계 지식/Algorithm] - Decision Tree란? :: ID3 알고리즘, 엔트로피란? Decision Tree란? :: ID3 알고리즘, 엔트로피란? 의사결정나무란? Decision Tree란? 의사결정 규칙을 나무구조로 나타내에 전체 데이터를 소집단으로 분류하거나 예측하는 분석기법 전체 데이터에서 마치 스무고개하듯이 질문하며 분류해나간다. 그 모양이 마치.. leedakyeong.tistory.com 2020/04/21 - [통계 지식/Algorithm] - 의사결정나무(Decision Tree) :: CART 알고리즘, 지니계수(Gini Index)란? 의사결정나무(Decision Tree) :: CART 알고리즘, 지니계수(Gini Index)란? 이전 포스팅에..

의사결정나무(Decision Tree) :: CART 알고리즘, 지니계수(Gini Index)란?

이전 포스팅에서 의사결정나무란 무엇인지, 어떤 기준으로 모델을 만들어가며 불순도가 무엇인지와 ID3 알고리즘에 대해 소개했다. 지난 포스팅 바로가기 https://leedakyeong.tistory.com/entry/Decision-Tree%EB%9E%80-ID3-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98 Decision Tree란? :: ID3 알고리즘, 엔트로피란? 의사결정나무란? Decision Tree란? 의사결정 규칙을 나무구조로 나타내에 전체 데이터를 소집단으로 분류하거나 예측하는 분석기법 전체 데이터에서 마치 스무고개하듯이 질문하며 분류해나간다. 그 모양이 마치.. leedakyeong.tistory.com 이번에는 의사결정나무의 또 다른 알고리즘인 CART 알고리즘에..

Decision Tree란? :: ID3 알고리즘, 엔트로피란?

의사결정나무란? Decision Tree란? 의사결정 규칙을 나무구조로 나타내에 전체 데이터를 소집단으로 분류하거나 예측하는 분석기법 전체 데이터에서 마치 스무고개하듯이 질문하며 분류해나간다. 그 모양이 마치 나무와 같아서 의사결정 나무라 부른다. 예) 나무에서 분할되는 부분을 노드(node) 라 하고, 가장 처음 노드를 root node, 가장 마지막 노드들을 terminal node라 한다. 그렇다면, 위의 예시에서 모양 or 색 중에서 무엇을 먼저, 어떤 기준으로 나눠야 할까? 그 답은 불순도가 낮아지는 방향으로 나눠야 하며, 그 방법으로 ID3, CART, C4.5 등 여러 알고리즘이 있다. 본 포스팅에서는 ID3에 대해 알아보고자 한다. ID3 알고리즘에 대해 알아보기에 앞서, 불순도란 무엇이며..

분류 모델 성능 평가 지표 - Confusion Matrix란? :: 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 Score

분류 모델 성능 평가 지표 Linear 모델에 대해서는 R-Square, MSE 등 으로 모델의 성능을 평가한다.그렇다면 분류 모델에 대해서는 모델의 성능을 어떻게 평가할 수 있을까? 여러가지 방법이 있지만, 대표적으로 사용하는 정확도(Accuracy), 정밀도(Precision), 재현도(Recall), F1 Score 에 대해 알아보고자 한다. 1. Confusion Matrix (오차행렬) 위 네가지 지표를 설명하기 전에 Confusion Matrix를 먼저 설명하고자 한다. Confusion Matrix란? Training 을 통한 Prediction 성능을 측정하기 위해 예측 value와 실제 value를 비교하기 위한 표 여기서 ACTUAL VALUES는 실제값, PREDICTIVE VALUE..

AI/기초통계 2020.04.07

로지스틱 회귀분석이란? What is Logistic Regression?

로지스틱 회귀분석이란? 지난 시간 언젠가 수치형자료와 범주형자료에 대해 다룬 적이 있다. >> 수치형 자료, 범주형 자료 바로가기 2019/08/12 - [통계 지식/기초통계] - [기초통계] 수치형 자료(numerical data)와 범주형 자료(categorical data) 2019/08/12 - [통계 지식/기초통계] - [기초통계] 수치형 자료(numerical data)와 범주형 자료(categorical data) 종속변수가 수치형 자료형일 때 Linear Regression으로 모델링한다면, 범주형 자료 중에서도 Binary(0 or 1로 표현할 수 있는 범주형 변수 ex- 남/여, 성공/실패, 합격/불합격 등) 일 때 Logistic Regression으로 Y에 대한 예측 모델을 만들 수..

AI/Regression 2020.03.27

[MSSQL] SQL Server 기초 : 테이블 생성(CREATE), 테이블 변경(ALTER) ; 제약조건 추가 / 제거

SQL Server 기초 1. 테이블 생성 : CREATE TABLE 1-1. 기본 CREATE TABLE [테이블명]([컬럼명1] [타입]([크기]),[컬럼명2] [타입], ...) 예) 123456CREATE TABLE TEST_TABLE( ID VARCHAR(10), 고객명 VARCHAR(10), 나이 INT, 가입날짜 DATETIME)cs 1-2. 제약조건 추가 * 제약조건의 종류 ① PRIMARY KEY② FOREIGN KEY③ UNIQUE④ CHECK⑤ DEFAULT⑥ NULL 예1) 123456CREATE TABLE TEST_TABLE( ID VARCHAR(10) NOT NULL PRIMARY KEY, -- NULL값 혀용 X, PK 고객명 VARCHAR(10), 나이 INT, 가입날짜 DA..

SQL 2020.03.18

윈도우 작업 스케줄러에 R script 등록하기

작업 스케줄러로 R script 자동 실행하기 :: R script로 윈도우 작업 스케줄러 등록하기 자동으로 매일 혹은 매 시간마다 R script를 실행시켜야 할 때가 있다.그럴 때 윈도우 작업 스케줄러를 활용한다. 시작 버튼 눌러 작업 스케줄러 검색하고 직접 적용시키는 방법도 있지만, 경로 설정 등의 헷갈리는 부분이 있어서 R script 에서 직접 적용시키는 방법을 소개하고자 한다. 1. 실행하고자 하는 R script를 작성한다. 12345png(paste0("PATH",format(Sys.time(), format = "%Y_%m_%d %H_%M_%S"),".png"))plot(x=1,y=1)dev.off() print(Sys.time())Colored by Color Scriptercs 현재 ..

R 2020.03.05

[MSSQL] RODBC로 R - MSSQL 연결하는 방법

R에서 MSSQL 연결하는 방법 R과 MSSQL이 설치되었다는 가정 하에 진행한다. R에서 SQL 서버를 연결하기 위해 RODBC 라이브러리를 사용한다. 이에 앞서, 컴퓨터에 미리 세팅을 해주어야 한다. 시작버튼을 눌러 ODBC를 검색한 후, 우클릭으로 관리자 권한으로 실행한다. 시스템 DSN으로 들어가 추가 클릭! SQL Server 로 설정 이름과 설명은 원하는데로, 서버는 SQL server와 같게 설정.여기서 설정한 이름은 후에 R에서 연결할 때 dsn parameter에 들어가니 꼭 기억하기! 기본 데이터베이스를 다음으로 변경 클릭 후 원하는 데이터베이스와 연결. 서버 자체와 연결을 원한다면 이 과정은 생략! 이렇게 세팅을 마치고 나면, R에서 RODBC 라이브러리를 통해 연결 할 수 있다. 1..

SQL 2020.03.04

[MSSQL] SQL server download (Windows10) : SQL server 설치 및 다운로드

SQL Server 설치 및 다운로드 (Windows 10) 아래 url Click! https://www.microsoft.com/ko-kr/sql-server/sql-server-downloads https://www.microsoft.com/ko-kr/sql-server/sql-server-downloads 개발자 무료버전 Click! 기본 유형 선택 언어 확인, 수락 Click 설치 위치 확인 후 설치 Click 각각의 경로 확인 후 SSMS 설치 Click. SSMS는 SQL Sever Management Studio의 약자로, 말 그대로 Studio이다. SSMS 설치 Click 시 SSMS 다운로드 페이지로 넘어간다. 다운로드 Click! 경로 확인 후 설치 설치 완료 후 재부팅, Micro..

SQL 2020.03.03

mySQL 설치 및 다운로드 : Download mySQL in windows 10

window10 에 mySQL 설치하기 다음 url로 들어간다. mySQL 설치경로 : https://dev.mysql.com/downloads/mysql/ mySQL 설치경로 : https://dev.mysql.com/downloads/mysql/ Windows 확인하고 Installer for Windows 클릭 (or Go to Dowonload Page Click!) 두 개 중 더 사이즈가 큰 아래거 클릭! Login or No thanks, just start my download click! Developer Default 확인하고 Next Click! Execute Click! Check Requirements에 있는 파일들이 모두 설치된다. Next 클릭! 위에서 설치 안된 파일을 설치할 ..

SQL 2020.03.02
반응형