반응형

전체 글 241

[Python] Pandas Tutorial :: Save Pandas Data Frame to CSV file

2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 2020/09/19 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: read csv, txt file with pandas 2020/09/21 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: Create Data Frame with Dictionary, List 판다스 데이터프레임을 csv 파일로 저장하기 0. Import Pandas Library import pandas as pd 1. Create DataFrame friend =..

[Python] Pandas Tutorial :: Create Data Frame with Dictionary, List

2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 2020/09/19 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: read csv, txt file with pandas 판다스로 데이터프레임 만들기 in python 0. Import Pandas Library import pandas as pd 1. Create Pandas Data Frame with Dictionary :: 딕셔너리로 판다스 데이터프레임 만들기 원하는 데이터를 딕셔너리 형태로 만든다. name, age, job 의 3 컬럼으로 이루어진 2 row 의 데이터프레임을..

[Python] Pandas Tutorial :: read csv, txt file with pandas

이전에 pandas란 무엇인지, 데이터 프레임과 시리즈에 대해 간단히 알아보았다. 2020/09/18 - [Python/Pandas Tutorial] - [Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란? 이번에는 ,(쉼표)로 분리된 csv, txt 파일과 /t(tab)으로 분리된 파일, header가 없는 파일을 불러오는 방법에 대해 알아보자. 판다스로 csv 파일 불러오기 0. import pandas library 0-1. pandas library가 설치되어 있는지 확인 > !conda list | grep pandas pandas 0.20.3 py36hd6655d8_2 참고 :: 설치된 library 목록 확인 > !conda list # package..

[Python] Pandas Tutorial :: pandas란? 데이터프레임이란? 시리즈란?

Pandas Tutorial :: Chapter 1 Pandas란 R에서 Data Frame과 같은 역할을 하며, 엑셀과 비슷한 역할을 한다고 보면 된다. 0. import pandas library pandas library를 import 하고 편의를 위해 pd라 이름붙여 준다. (padnas.~~ 이 아니라 pd.~~ 로 줄여서 불러올 수 있다.) import pandas as pd 1. Read csv file with pandas pandas로 로컬에 저장되어있는 csv 파일을 불러오는 코드는 다음과 같다. data_frame 이라는 이름으로 저장해 주었다. data_frame = pd.read_csv('01. Data/friend_list.csv') 본 과정에서 불러온 파일은 아래 첨부된 파일이..

[R] caret 패키지로 modeling & model tuning (iris classification :: knn algorithm)

이전에 caret 패키지로 Data Scaling 하는 방법을 알아보았다. 2020/09/03 - [R] - [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 [R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화 Data Scaling in R 데이터 scale 이란 전처리 과정 중 하나로, 각 컬럼의 분포를 맞춰주기 위해 필요한 과정이다. scale 과정 없이 모델링을 한다고 했을 때 문제점은 예를 들어, X1의 범위는 0~1 이고, X2의 leedakyeong.tistory.com 이번에는 caret 패키지를 이용하여 모델을 만들고..

R 2020.09.16

[R] GA 특정 값으로 최적화 하는 방법 (no Maximizing) :: How to optimize with GA specific values in R

R에서 GA 최대값으로 최적화 하지 않고, 지정된 값으로 최적화 하는 방법 Genetic Algorithm(GA - 유전 알고리즘) 최적화 문제를 해결하는 기법 중 하나로, 생물의 진화를 모방한 방법이다. R에서는 GA 패키지로 제공되고 있으며, 기본적으로 주어진 fitness function을 최대화 하는 방향으로 최적화 한다. (function에 -(minus)를 붙여주면 최솟값으로 최적화 할 수도 있다. 자세한 방법은 아래 실습에서 다루겠다.) 1. Maximizing 우선, 주어진 function을 최대화 하는 기본적인 코드는 다음과 같다. 주어진 function은 다음과 같고, 찾고자 하는 x의 범위는 -10 ~ 10라 하자. $$ function : (x^2+x)*cos(x) $$ 해당 fun..

AI/Optimization 2020.09.14

[R] caret 패키지로 scale 하는 방법 :: scale in R (preProcess in caret) :: 표준화 vs 정규화

Data Scaling in R 데이터 scale 이란 전처리 과정 중 하나로, 각 컬럼의 분포를 맞춰주기 위해 필요한 과정이다. scale 과정 없이 모델링을 한다고 했을 때 문제점은 예를 들어, X1의 범위는 0~1 이고, X2의 범위는 100000~10000000, Y값의 범위는 100000~10000000 이라하자. 사실 X1이 중요한 변수라 해도 그 값이 너무 작아 Y에 영향을 미치지 못한다고 판단할 수 있다. 외에도 계산 과정에서 수렴, 발산 등의 문제도 발생할 수 있다. scale 방법에 여러가지가 있는데, 가장 많이 사용하는 두 가지 방법을 소개하고자 한다. 1. 표준화(Standardization) 각 observation이 평균으로 부터 어느정도 떨어져 있는지 나타낼 때 사용된다. 값의..

R 2020.09.03

[R Markdown] for loop로 chunk 여러개 만들기

R에서 마크다운으로 작업을 하다보면 컬럼만 다른 똑같은 그래프 혹은 테이블을 여러개 만들어야 하는 경우가 있다. 한 두개라면 그냥 복사 + 붙여넣기로 chunk를 새로 만들면 되지만, 그 수가 많아지면 일일이 만들기가 번거롭다. 이럴 때 하나의 chunk 안에 for 문으로 여러 chunk를 생성하는 방법을 소개하고자 한다. 1. Create multi Headers using for loop in one chunk 예제 데이터는 iris를 사용한다. 1 data

R/MarkDown 2020.07.31

의사결정나무(Decision Tree) :: 과적합(overfitting) 해결방법 :: 가지치기, 앙상블(Random Forest)

2020/04/21 - [통계 지식/Algorithm] - Decision Tree란? :: ID3 알고리즘, 엔트로피란? Decision Tree란? :: ID3 알고리즘, 엔트로피란? 의사결정나무란? Decision Tree란? 의사결정 규칙을 나무구조로 나타내에 전체 데이터를 소집단으로 분류하거나 예측하는 분석기법 전체 데이터에서 마치 스무고개하듯이 질문하며 분류해나간다. 그 모양이 마치.. leedakyeong.tistory.com 2020/04/21 - [통계 지식/Algorithm] - 의사결정나무(Decision Tree) :: CART 알고리즘, 지니계수(Gini Index)란? 의사결정나무(Decision Tree) :: CART 알고리즘, 지니계수(Gini Index)란? 이전 포스팅에..

티스토리 :: 새 에디터(새로운 글쓰기)에 글상자 추가하는 방법

티스토리 새로운 글쓰기에 글상자 기능 추가하는 방법 티스토리에서 새 에디터로 업데이트를 한 지 꽤나 많은 시간이 지났다. 하지만, 없어진 기능도 많고 불편해서 그동안 쭉 지난 에디터를 사용해 왔다. 최근들어 지난 에디터는 더이상 관리를 안하는지 기능들에 자꾸 문제가 생겼다. 분명 링크를 걸었는데, 막상 발행 후에는 링크 기능이 없어진다던가, 파일을 올렸는데 나 외에 다른 사람들은 파일을 다운받을 수 없는 등 문제가 많았다. 결국, 새 에디터를 써야겠다 마음먹었으나, 자주 사용하던 기능인 "글상자" 기능이 아예 없어서 "서식" 기능으로 글상자 기능을 추가하는 방법을 찾았다. (이 방법대로 하면 글상자 기능 뿐 아니라, 이전 버전에서는 가능했으나 새 에디터에는 없는 다른 기능들도 추가할 수 있다.) 그 방법..

카테고리 없음 2020.04.21
반응형