Random Forest

Jan 31, 2019

Random Forest

랜덤포레스트는 많은 결정 트리(Decision tree)로 이루어져 있습니다. 그것들은 결정 트리의 앙상블이며,       각 결정 트리는 주어진 모집단을 분류하는 데 사용 된 속성의 하위 집합을 사용 하여      만들어 집니다. 이러한 결정 트리는 입력 데이터의 인스턴스를 분류하는 방법에 대해 투표하고, 랜덤포레스트가 최상의 예측을 선택하기 위해 해당 투표를 ‘bootstrap’ 합니다. 이는 결정 트리의     단점인 ‘overfit(과적합)’ 상태를 방지하기 위해 수행됩니다.

랜덤 포레스트는 지도 학습 분류 알고리즘입니다. 그것은 Forest(결정 트리들)를 만들고 노드를   내려서          무작위로 나눕니다. Forest에 결정 트리가 많을수록 더 좋은 결과를 만들어 낼 수 있습니다.

대상 및 기능이 포함된 훈련 데이터 세트를 결정 트리에 입력하면 예측을 수행하는 데 사용 할 수 있는 규칙      집합이 공식화 됩니다.

예 : 당신의 e-commerce 웹 사이트 방문자가 미스터리 소설을 즐기는 지에 대한 예측을 하고 싶을 때 먼저     읽고 좋아했던 과거 책에 대한 정보를 수집하세요. 페이지수, 작가, 출판일, 해당   시리즈의 부분 등 결정 트리에는 해당 기능에 적용되는 규칙들이 있습니다. 예를 들면 아주 긴 책을 좋아하는 독자도 있고 그렇지 않은      독자도 있습니다. 새로운 소설에 대한 메타 데이터를 입력하면 해당 웹 사이트 방문자가 해당 소설을 원할      것인지 아닌지에 대한 예측이 가능합니다. 노드를 정렬하고 규칙을 정의하는 것은 Gini-Index 계산에              의존합니다. 랜덤 포레스트는 루트 노드를 찾고 해당 노드를 임의로 분할합니다.

Share:

Most Recent Posts

데이터셋과 머신러닝

Feb 12, 2019, 1:52 AM

머신러닝에서 사용되는 데이터셋에 대해 알아보자

Supervised Learning

Jan 31, 2019, 6:08 PM

A Beginner’s Guide to Supervised Learning

AI vs ML vs DL

Jan 31, 2019, 6:02 PM

AI vs ML vs DL

Random Forest

Jan 31, 2019, 5:12 PM

Random Forest

자동화된 머신러닝과 AI

Jan 31, 2019, 9:58 AM

자동화된 머신러닝과 AI 블로그

 

 

 

© 2017 IMGURU, Inc. All rights reserved.

 
서울 금천구 가산디지털1로 181 가산 W 센터 710호
우편번호 : 08503  |  전화번호 : 070-4099-2021  |  이메일 : imguru@imgr.co.kr