🤔 편향/분산 트레이드오프

모델의 새로운 데이터를 예측할 때, 모델의 오차는 다음 세 가지의 오차의 합으로 표현할 수 있다. 자세한 유도과정은 단순한 계산의 반복이기에 따로 다루지 않겠다.

(모델의 오차) = (편향)^2 + (분산) + (줄일 수 없는 오차)

따라서 모델의 오차를 평가할 때 편향과 분산을 고려한다. 일반적으로 모델의 복잡도가 커지면 분산은 증가하고 편향은 줄어드는 경향이 있다.

bias_var_decom.png

Q1. 위 그래프에서 가장 적절한 모델의 복잡도는 어느 부분일까?

👮‍♂️ 규제가 있는 선형 모델