Data Analysis/Machine Learning

[ISLP] Logistic Regression 이론

Jiyeon's Desk 2025. 3. 20. 15:47

 

 

로지스틱 회귀분석은 종속변수가 이진 또는 다항값을 가질 때, 그 확률을 예측하기 위한 통계적 모델이다. 선형 회귀와 달리 예측값을 확률로 변환하여 직접 예측할 수 있다.  Y값은 x값이 0.5보다 크면 1로 반환하고(lap: 'up'을 의미), 작으면 0으로 반환하다(lap: 'down'을 의미). 

 

모델의 최적의 계수를 찾기 위해서는 최대 우도 추정법을 사용하고, 우도 함수를 그대로 사용하면 계산이 어려워서 로그 우도 함수를 사용한다. x가 한 단위 증가할 때, y가 1이 될 확률이 얼마나 변하하는지를 나타내는 값이다!! 계수는 로그 오즈를 얼마나 변화시키는지를 의미한다.

예를 들어, beta = 0.7 -> e^0.7 =2.0138 이면 x가 한 단위 증가할 때, y=1이 될 오즈(확률)이 2배 증가한다.