Programming/python

python 정규화 모델 (변수 간 과적합 방지)

Jink_23 2023. 10. 20. 17:51
728x90
반응형

 

 

변수의 수가 많아 과적합으로 인해 모델의 예측력이 떨어질 경우

비용함수에 패널티를 추가

 

Lasso )  회귀 계수의 크기를 0 으로 만듬

 

Ridge )  회귀 계수의 크기를 감소 시킴

 

 

아래는, 변수  case 에서 실험 진행하였습니다.

 

(underfitting 해결 위해 다항회귀는 아래 참고해 주세요)

 

python 다항회귀 > underfitting (언더피팅) 시 사용

변수가 부족하여 underfitting이 일어날 때 사용합니다. 아래 참고) ↓ ↓ ↓ ↓ 변수 증가는 Combination으로 계산하면 됩니다. < Code > PolynomialFeatures - degree : 차수 설정 - include_bias : 상수항 제거

jink0318.tistory.com

 

Data 비교

 - Lasso & Ridge 에서 alpha : 숫자가 높을수록 비용함수에 패널티를 많이 준다고 보시면 됩니다. (Default = 1)

 

1. 다항회귀 전 선형 회귀

 

 

2. Lasso

 

 

3. Ridge

 

 

Linear Regression  &  Lasso  &  Ridge

모델 결과 비교

 

 

 

 

 

 

 

728x90
반응형