AI Tech

분류기 (Classifier)

cpnubplzhelp 2024. 8. 12. 15:55
분류기 (Classifier)는 머신러닝에서 주어진 데이터를 사전 정의된 클래스로 분류하는 모델이다
.
분류 문제는 데이터 포인트가 주어졌을 때 이 데이터가 어느 클래스에 속하는지를 예측하는 것이다.
ex) 메일이 스팸인지 아닌지 분류하기, 이미지가 개인지 고양이인지 분류하기
 
 
다양한 분류기의 종류 중 다음 3가지에 대해서 알아보자.
K-최근접 이웃 분류기 (K-Nearest Neighbors Classifier, KNN)
선형 분류기 (Linear Classifier)

 

 

K-최근접 이웃 분류기 (K-Nearest Neighbors Classifier, KNN)

 

k-최근접 이웃 알고리즘 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 패턴 인식에서 k-최근접 이웃 알고리즘(또는 줄여서 k-NN)은 분류나 회귀에 사용되는 비모수 방식이다.[1] 두 경우 모두 입력이 특징 공간 내 k개의 가장 가까운

ko.wikipedia.org

 

선형 분류기 (Linear Classifier)

 

선형 분류 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 기계 학습 분야에서 통계적 분류는 개체의 속성을 이용하여 그 개체가 속하는 그룹, 또는 클래스를 판별하는 것을 목표로 한다. 선형 분류에서는 주어진 속성

ko.wikipedia.org

 

선형 분류기 (Linear Classifier)는 데이터 포인트를 직선 또는 평면과 같은 선형 결정 경계를 사용하여 분류하는 머신러닝 모델이다. 이 모델은 입력 특성의 선형 조합을 통해 클래스 레이블을 예측한다.

 

모델의 수식:

예측된 출력값 y를 사용하여 클래스를 결정한다. 

예측된 출력값의 해석을 쉽게하기 위해서 Softmax함수를 사용할 경우 Softmax Classifier가 된다.

 

소프트맥스 분류기 (Softmax Classifier)

소프트맥스 분류기 (Softmax Classifier)는 다중 클래스 분류 문제를 해결하기 위해 사용되는 선형 분류기이다. 소프트맥스 분류기는 각 클래스에 대한 확률을 계산하여, 가장 높은 확률을 가진 클래스를 예측한다.

 

앞서 선형 분류기에서 예측한 y값에 softmax 함수를 사용하여 확률을 0과 1사이로 정규화 한다.

 

Softmax 함수:

소프트맥스 함수를 이용하면,

 

확률적 출력: 소프트맥스 함수는 각 클래스에 대한 확률을 계산하므로, 예측의 불확실성을 자연스럽게 표현할 수 있으며, 이를 통해 모델이 각 클래스에 대해 얼마나 확신하는지 파악할 수 있다

 

정규화: 클래스 확률의 합을 1로 정규화하여, 예측값이 확률 분포로 해석될 수 있게 한다. 이는 모델의 출력을 해석하고 평가하는 데 도움을 준다.

 

해석 : 확률 출력 덕분에 모델의 결정이 직관적으로 이해할 수 있게 만들어준다.