AI Tech

Binary Classification with Pytorch

cpnubplzhelp 2024. 8. 8. 15:24

이진 분류(Binary Classification)

주어진 입력 데이터를 두 개의 상호 배타적인 클래스 중 하나로 분류하는 문제이다. 이진 분류 문제의 주요 목표는 데이터 포인트가 두 클래스 중 어떤 것에 속하는지를 예측하는 것다.

 

로지스틱 회귀(Logistic Regression)

이진 분류 문제를 해결하기 위한 통계적 모델이다.

입력 특성 벡터 x와 가중치 벡터 w의 내적과 편향 를 이용해 선형 결합을 계산한 후, 이 값을 시그모이드 함수에 통과시켜 확률값으로 변환한다.

 

 

시그모이드 함수는 선형 결합을 통해 생성된 입력값 z를 0과 1 사이의 확률로 변환한다.

예측확률이 확률이 0.5 이상이면 클래스 1로 예측하고, 그렇지 않으면 클래스 0으로 예측한다.

 

●      손실함수

로지스틱 회귀는 Binary Cross-Entropy Loss를 이용한다. 

(우리가 흔히 알던 MSE대신 BCE를 사용하는 이유가 무엇일까?)

https://nmincho.tistory.com/58

 

로지스틱 회귀(Logistic Regression)에서 BCE를 사용하는 이유

로지스틱 회귀에서는 선형회귀에서 사용하던 MSE대신 BCE를 사용하는 이유가 무엇일까? Binary Cross-Entropy (BCE)  ● 목적: 이진 분류 문제에서 확률을 예측하는 모델의 성능을 평가하는 데 사용된

nmincho.tistory.com

 

 

여기서 N은 샘플수, yi는 실제 레이블, pi는 예측 확률이다.

●      경사하강법

로지스틱 회귀 또한 경사하강법을 사용하여 파라미터(w와 b)를 업데이트한다.