AI Tech
Binary Classification with Pytorch
cpnubplzhelp
2024. 8. 8. 15:24
이진 분류(Binary Classification)
주어진 입력 데이터를 두 개의 상호 배타적인 클래스 중 하나로 분류하는 문제이다. 이진 분류 문제의 주요 목표는 데이터 포인트가 두 클래스 중 어떤 것에 속하는지를 예측하는 것다.
로지스틱 회귀(Logistic Regression)
이진 분류 문제를 해결하기 위한 통계적 모델이다.
입력 특성 벡터 x와 가중치 벡터 w의 내적과 편향 를 이용해 선형 결합을 계산한 후, 이 값을 시그모이드 함수에 통과시켜 확률값으로 변환한다.
시그모이드 함수는 선형 결합을 통해 생성된 입력값 z를 0과 1 사이의 확률로 변환한다.
예측확률이 확률이 0.5 이상이면 클래스 1로 예측하고, 그렇지 않으면 클래스 0으로 예측한다.
● 손실함수
로지스틱 회귀는 Binary Cross-Entropy Loss를 이용한다.
(우리가 흔히 알던 MSE대신 BCE를 사용하는 이유가 무엇일까?)
https://nmincho.tistory.com/58
로지스틱 회귀(Logistic Regression)에서 BCE를 사용하는 이유
로지스틱 회귀에서는 선형회귀에서 사용하던 MSE대신 BCE를 사용하는 이유가 무엇일까? Binary Cross-Entropy (BCE) ● 목적: 이진 분류 문제에서 확률을 예측하는 모델의 성능을 평가하는 데 사용된
nmincho.tistory.com
여기서 N은 샘플수, yi는 실제 레이블, pi는 예측 확률이다.
● 경사하강법
로지스틱 회귀 또한 경사하강법을 사용하여 파라미터(w와 b)를 업데이트한다.