Data Science/머신러닝

모델 성능 평가(회귀)

Boxya 2025. 4. 3. 20:49

[KT] AIVLE SCHOOL 7일차

 

회귀 모델 평가

  • 회귀 모델이 정확한 값을 예측하기는 사실상 어려움
  • 예측 값과 실제 값에 차이(=오차)가 존재할 것이라 예상함
  • 예측 값이 실제 값에 가까울 수록 좋은 모델이라 할 수 있음
    • 예측한 값과 실제 값의 차이(=오차)로 모델 성능을 평가
    • 오차를 줄여야 함 (작을수록 좋음)
  • MSE(Mean Squared Error)
    • 오차 제곱(SSE)의 합을 구한 후 평균을 구함 (자주 사용)
  • RMSE(Root Mean Squared Error)
    • 오차의 제곱이므로 루트를 사용해 일반적인 값으로 표현
  • MAE(Mean Absolute Error)
    • 오차 절대값의 합을 구한 후 평균을 구함
  • MAPE(Mean Absolute Percentage Error)
    • 오차 비율을 표시하고 싶은 경우 사용

결정 계수 R² (R-Squared)

  • Coefficient of Determination
  • MSE로 여전히 설명이 부족한 부분이 있음(성능이 확실히 와 닿지 않음)
  • 모델 성능을 잘 해석하기 위해서 만든 MSE의 표준화된 버전
  • 전체 오차 중에서 회귀식이 잡아낸 오차 비율(일반적으로 0 ~ 1 사이) (클 수록 좋음)
  • 오차의 비 또는 설명력이라고도 부름
  • R² = 1이면 MSE = 0 이고 모델이 데이터를 완벽하게 학습한 것
  • SST(Sum Squared Total) : SST= SSR + SSE / 실제값과 평균의 차이의 제곱
  • SSR : SSR = SST - SSE / 평균과 모델의 예측값의 차이의 제곱
  • 우리 모델이 평균보다 더 많이 해결해낸 것

 

 

'Data Science > 머신러닝' 카테고리의 다른 글

모델 성능 튜닝  (1) 2025.04.03
머신러닝 알고리즘  (0) 2025.04.03
모델 성능 평가(분류)  (0) 2025.04.03
머신러닝 모델링  (0) 2025.04.03