Unsupervised Learning

Jan 31, 2019

A Beginner’s Guide to Unsupervised Learning

지도학습과는 다르게 비지도 학습은 레이블 데이터 셋이 없습니다.

레이블이 없는 경우, 입력된 데이터를 재구성 하거나 임베딩(embedding) 하는 방법을 사용합니다.

컨텐츠

  • - Visualization(시각화)
  • - K-Means Clustering
  • - Transfer Learning
  • - K-Nearest Neighbors

1. Visualization

T-distributed stochastic neighbor embedding(T-SNE) 는 고차원의 데이터를 2차원 또는 3차원으로 축소하는 알고리즘으로 산점도(Scatterplot)로 표현 할 수 있습니다. T-SNE는 데이터의 잠재적   경향을 찾는데              사용됩니다. Deeplearning4j(딥러닝 오픈소스) 는 일부 시각화를 위해 T-SNE에   의존합니다.

랜더링 – Deeplearning4j는 시각적 랜더링을 휴리스특으로 사용하여 신경망이 얼마나 잘 학습되고 있는지     모니터링 합니다. 즉, 랜더링은 디버깅하는 데 사용됩니다. 시간이 지남에 따라 시각화가 얼마나 학습하고     있는지 나타내는 지표 입니다.

 

2. K-Means Clustering

K-Means는 벡터 공간에서 다른 입력으로부터 원시 거리를 기반으로 활성화 레이블을 자동으로 지정하는 데 사용되는 알고리즘 입니다. 목표 또는 loss function은 없습니다. K-means는 무게중심을 활용합니다.                K-Means 는 모든 데이터 포인트의 반복 된 평균화를 통해 중심을 만듭니다.

K-Means는 주어진 중심에 근접하여 새로운 데이터를 분류합니다. 각 중심은 레이블과 연관되어 있습니다.

 

3. Transfer Learning

Transfer Learning은 하나의 신경망의 활성화를 가져 와서 다른 알고리즘이나 분류 자의 기능으로 사용 하도록 합니다. 얘를 들어, ImgeNet에서 훈련한 ConvNet의 모델을 가져와서 K-Nearest Neighbor 와 같은 다른    알고리즘으로 새로운 이미지를 전달 할 수 있습니다. Transfer Learning의 엄격한 정의는 단지 하나의            데이터 집합에 대해 훈련된 모델을 가져 와서 다른 문제에 꽂는 것입니다.

 

4. K-Nearest Neighbors

Mike Depies는 Deeplearning4j와 K-Nearest Neighbor 를 결합하는 방법의 튜토리얼을 만들 었습니다.

이 알고리즘은 분류 및 회귀의 목적으로 사용되며 kd 트리를 사용합니다. Kd 트리는 k 번째 차원 공간에서      점의 유한한 세트를 저장하는 데이터 구조입니다. 그것은 임의의 차원의 공간을 나무로 나누며 이를 유리한      지점 트리라고 합니다. Kd-tree는 트리 구조로 공간을 세분하고 트리를 탐색하여 가장 가까운 점을 찾습니다. 가장 가까운 점과 연관된 레이블이 입력에 적용됩니다.

Share:

Most Recent Posts

 

 

 

© 2017 IMGURU, Inc. All rights reserved.

 
서울 금천구 가산디지털1로 181 가산 W 센터 710호
우편번호 : 08503  |  전화번호 : 070-4099-2021  |  이메일 : imguru@imgr.co.kr