반응형

전체 글 250

Linear Regression :: Least Square Method(최소제곱법, 최소자승법) :: 회귀 계수 추정

선형 회귀분석에서 회귀 계수(모수) 추정하는 방법 : 최소제곱법, 최소자승법 Linear Regression은 x(독립변수)로 y(종속변수)를 가장 잘 설명할 수 있는 선형식을 찾아 y값을 예측할 수 있는 모델을 만드는 기법이다.x변수의 갯수가 n개라 할 때 추정되는 선형식은 다음과같다. $$\hat{y}=\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_nx_n$$ 이 때 저 $\beta$들을 회귀 계수라 부르며, 이를 추정하는 방법을 최소제곱법(=최소자승법=Least Square Method)이라 한다.  최소제곱법의 기본 원리는 잔차(관측값과 예측값의 차이) 제곱 합을 최소화 하는 회귀계수를 찾는 것이다.  $x$변수가 1개인 단순 선형 회귀라 가정 할 때 아래 식을 최소화하는..

Linear Regression 기본 가정 네가지 :: 선형성, 다중공선성, 등분산성, 정규성

선형 회귀분석 기본 가정 네가지선형성, 다중공선성, 등분산성, 정규성  Linea Regression은 모수를 추정하는 방식이다. 즉, X(독립변수)로 Y(종속변수)를 예측하는 다음과 같은 식을 만드는데  $$y=w_0+w_1x_1+w_2x_2+...+w_nx_n$$ $w$ 를 모수라 하며, 이 모수를 추정하여 $x$로 $y$를 예측한다. 이때 추정한 모수들이 신뢰성이 있으려면 네 가지 가정을 만족해야 한다. 네 가지 가정에 대해 1. 가정의 의미2. 가정을 만족해야 하는 이유3. 가정을 확인하는 방법4. 만족하지 못할 시 해결방법에 대해 알아보겠다.  1. 선형성 선형 회귀분석은 이름에서도 알 수 있듯이 x와 y의 선형식을 구해서 x로 y를 예측하는 모델이기때문에 당연히 x와 y의 관계가 선형이어야 한..

AI(Artificial Intelligence) VS ML(Machine Learning) VS DL(Deep Learning)

인공지능, 머신러닝, 딥러닝 개념 및 차이점  결론부터 말하자면 세 가지는 서로 아예 다른 개념이 아니라 하위의 개념이다.인공지능 안에 머신러닝이 있고, 머신러닝의 여러 알고리즘들 중 하나가 딥러닝이다.  인공지능(AI - Artificial Intelligence)는 말 그대로 인간의 지능을 모방한 기계를 뜻한다.문제 해결, 추론, 학습, 자연어, 로봇 등등 인간이 수행할 수 있는 다양한 작업을 컴퓨터가 수행하도록 한 모든 분야를 의미한다. 그 중 데이터에 기반하여 학습하고 추론하고 분석하는 것들을 머신러닝이라 한다. 머신러닝에는 수많은 알고리즘들이 있는데, 그 중에서도 신경망(Neural Networks)에 관련된 알고리즘이 바로 딥러닝이다.   딥러닝이라는 분야가 워낙 핫하다보니 어떤 데이터든, 어..

AI/잡지식 2024.09.02

[KNIME] Hyper parameter optimization

KNIME에서 하이퍼파라미터 튜닝 실습 KNIME에서 Parameter Optimization Loop Start 노드와 Parameter Optimization Loop End 노드를 활용하여 하이퍼파라미터 tuning하는 방법을 알아보겠다. KNIME 내에서 Loop의 개념과 Flow Variables에 대한 개념을 알고있어야하는데, 이전 포스팅에 설명해두었다.2024.08.28 - [KNIME] - [KNIME] Loop 실습(1)2024.08.28 - [KNIME] - [KNIME] Loop 실습(2)2024.08.29 - [KNIME] - [KNIME] Loop 실습(3)  활용할 데이터는 KAMP에서 가져온 데이터로, 간단한 전처리는 이미 완료된 데이터이다.   CSV Reader 노드로 데이..

KNIME 2024.09.02

[KNIME] Loop 실습(3)

지난 포스팅에 이어 Window Loop Start와 Generic Loop Start 노드에 대해 알아보겠다. 1. 활용할 데이터에 대한 설명 및 첨부파일과2. Loop 노드에 대한 기본적인 설명3. Counting Loop Start 노드에 대한 설명4. Flow Varaibles에 대한 설명은 아래 링크에 있으며2024.08.28 - [KNIME] - [KNIME] Loop 실습(1) [KNIME] Loop 실습(1)KNIME 노드에 loop를 검색하면 다양한 노드들이 나온다.  오늘은 이 Loop 노드들에 대해서 알아보고 실습해보겠다.  Loop 노드는 이름에서 알 수 있듯이 뭔가를 반복적으로 수행하는 노드이다.Loop Sleedakyeong.tistory.com Group Loop Start 노..

KNIME 2024.08.29

[KNIME] Loop 실습(2)

이전 포스팅에서 KNIME에서 Loop 노드가 어떤 역할을 하는지와 Counting Loop Start 노드 및 Flow variable에 대해 알아보았다.2024.08.28 - [KNIME] - [KNIME] Loop 실습(1) [KNIME] Loop 실습(1)KNIME 노드에 loop를 검색하면 다양한 노드들이 나온다.  오늘은 이 Loop 노드들에 대해서 알아보고 실습해보겠다.  Loop 노드는 이름에서 알 수 있듯이 뭔가를 반복적으로 수행하는 노드이다.Loop Sleedakyeong.tistory.com 이어서 다른 loop 노드들도 알아보도록 하겠다. (사용할 데이터는 이전 포스팅에 첨부되어있다.)  2. Group Loop Start Group Loop Start는 어떤 Group 별로 반복을..

KNIME 2024.08.29

[KNIME] Loop 실습(1)

KNIME 노드에 loop를 검색하면 다양한 노드들이 나온다.  오늘은 이 Loop 노드들에 대해서 알아보고 실습해보겠다.  Loop 노드는 이름에서 알 수 있듯이 뭔가를 반복적으로 수행하는 노드이다.Loop Start 노드와 Loop End 노드가 짝꿍이며, 그 사이에 들어간 노드들을 반복 수행하는 역할을 한다.   Loop Start 노드도 종류가 여러개이고 Loop End 노드도 종류가 여러개인데 어떤 기준으로 반복하느냐에 따라 종류가 나뉜다. 예를 들어 그냥 n번 반복 수행하고 싶으면 Counting Loop Start 노드를 사용하고여러 컬럼들에 동일한 처리를 해주고 싶으면 Column List Loop Start 노드를 사용한다. Loop Start 노드가 더 종류가 많고 Loop End는 따..

KNIME 2024.08.28

[KNIME] String to Date&Time 노드 실습(format 설정)

KNIME에서 string type으로 불러와진 시간에 관련된 컬럼을 Date Time type으로 변경하는 실습을 해보도록 하겠다.시간에 관련된 컬럼을 String 타입 그대로 사용하는게 아니라 Date(or Date Time) 타입으로 바꿔주는 이유는 시간에 관련된 처리를 하기 위함이다. 예를 들어 특정 시간을 기준으로 직전까지와 이후 시간으로 데이터를 나누고 싶거나,  얼마의 시간을 더하거나 빼거나 등 시간에 대한 처리를 하기 위해 Date 타입으로 바꿔주어야 한다.  실습에 사용할 데이터는 다음과 같다.   11,210건의 행과 4개의 열을 가지고 있다.  xlsx 파일이므로 Excel Reader 노드로 읽어오면되고 해당 노드에 대한 설명은 이전 포스팅(2024.08.27 - [KNIME] - ..

KNIME 2024.08.27

[KNIME] 엑셀(xlsx) 파일 읽기 :: Excel Reader

KNIME에서 엑셀파일 읽기KNIME에서 xlsx 확장자인 엑셀파일 읽는방법을 알아볼건데1. 데이터가 A1에서부터 시작하지 않을 때 데이터 읽는 방법과2. 여러개의 시트가 존재할 때 첫 번째 시트가 아닌 다른 시트들을 읽는 방법에 대해 알아보겠다. 실습에 사용할 데이터는 다음과 같다.   xlsx 확장자인 엑셀파일이며,다음과 같이 시트1과 시트2로 이루어져있다.  시트1은 세 개의 컬럼이 있으며 데이터가 A1에서 시작하지 않고 B2에서 시작한다.  시트2는 한 개의 컬럼으로 이루어져있으며, A1에서부터 데이터가 시작한다.   우선 데이터가 B2에서 시작하는 시트1 데이터를 불러오는 방법을 알아보겠다.사용할 노드는 Excel Reader 이다. 더블클릭하거나 노드에 마우스 대고 왼쪽 위 설정표시 누르면 옵..

KNIME 2024.08.27

[Python - 프로그래머스] 게임 맵 최단거리(DFS/BFS 연습)

https://school.programmers.co.kr/learn/courses/30/lessons/1844 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr Solution from collections import deque def solution(maps): dx = [0,0,-1,1] dy = [-1,1,0,0] r = len(maps); c = len(maps[0]) visited = [[False]*c for _ in range(r)] que = deque([(0,0)]) while que : x,y = que.popleft() for i in..

반응형