반응형

clustering 4

[R] DBSCAN R 코드, 예시, 해석, 파라미터 조정 방법

지난 포스팅에서 DBSCAN논문을 리뷰해 보았다. 이번에는 R에서 DBSCAN을 어떻게 사용하는지 알아보고자 한다. >> DBSCAN 논문 리뷰 바로가기 >> 원하는 클러스터 모양이 없을 때 파라미터 조정방법 바로가기 in R 1. DBSCAN및 그래프를 그리기 위한 package loading - DBSCAN은 "fpc" library에 구현되어 있다. 1 2 library(fpc) library(ggplot2) cs 2. clustering할 데이터 생성 및 시각화 1 2 3 4 5 data db$isseed # 각 포인트별 core point인지 아닌지 [1] TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE FALSE TRUE TRUE TRUE TRUE TRUE [..

AI/Clustering 2019.08.20

[논문] DBSCAN 리뷰 : Density Based Spatial Clustering of Applications with Noise

이전 포스팅에서 군집분석에 대해 알아보았다. >> 군집과 분류의 차이 바로가기 >> 군집분석이란? (What is clustering?) 바로가기 >> DBSCAN in R 바로가기 >> R에서 DBSCAN 파라미터 조정방법 바로가기 이번 포스팅에서는 밀도 기반(Density-based) 군집분석인 DBSCAN 알고리즘 논문 해석 및 리뷰를 해보고자한다. 본 논문은 1996년에 나왔다는 점을 고려해야한다. 논문링크 : https://www.aaai.org/Papers/KDD/1996/KDD96-037.pdf Abstract 클러스터링 알고리즘은 공간(spatial) 데이터베이스에서 class를 식별하는 작업에 적합하다. - spatial database : 좌표공간에 뿌려진 데이터들 그러나, 대규모의 공..

AI/논문 2019.08.19 (4)

군집분석이란? (What is clustering algorithm?)

지난 포스팅에서 군집(clustering)과 분류(classification)의 간단한 정의와 차이점을 알아보았다. >> 군집과 분류의 차이 바로가기 이번에는 군집분석(clustering)에 대해 좀 더 깊게 알아보겠다. 1. 군집분석이란? 군집분석이란? 개체를 분류하기 위한 명확한 분류기준이 존재하기 않거나 기준이 밝혀지지 않은 상태에서 주어진 데이터들의 특성을 고려해 같은 그룹(클러스터)를 정의하고, 다른 클러스터의 개체보다 서로 더 유사한 개체가 되도록 그룹화하여 그룹의 대표성을 찾아내는 방법이다. 여기서 cluster란? cluster란? 비슷한 특성을 가진 데이터들의 집합이다. 2. 군집분석의 원리 군집분석의 원리는 크게 두 가지가 있다. ① 군집 내 응집도 최대화 ② 군집 내 분리도 최대화 ①..

AI/Clustering 2019.08.18 (2)

[논문] DEC 리뷰 : Unsupervised Deep Embedding for Clustering Analysis

Unsupervised Deep Embedding for Clustering Analysis(DEC) arXiv : 24 May 2016 논문 링크 : https://arxiv.org/pdf/1511.06335.pdf 깃 링크 : https://github.com/piiswrong/dec 1. Introduction - 데이터 분석과 visualization에서 핵심인 Clustering은 각기 다른 관점에서 unsupervised machine learning으로 널리 연구되어 왔다. * What defines a cluster? * What is the right distance metric? * How to efficiently group instances into cluster? * How to ..

AI/논문 2018.09.19 (2)
반응형