카지노 꽁 머니 부스팅 (Gradient Boosting)
이번 글에서는 의사결정나무를 활용한 앙상블 모델 가운데 카지노 꽁 머니 부스팅 알고리즘에 대해 알아보려고 한다.
흔히 카지노 꽁 머니이란 무언가를 한껏 강화시키는 의미로 사용되는데 머신러닝에서 카지노 꽁 머니은 약한 모델을 여러 번 순차적으로 적용해 강한 모델을 만들어 나가는 것을 의미한다.
그런 점에서 앞서 랜덤 포레스트가 여러 개의 의사결정나무를 중복적으로 샘플링한 데이터셋에 적용한 결과를 평균함으로써 다양한 데이터셋에 강한 모델을 만들었다면 부스팅은 이전 학습기 (의사결정 나무)가 잘못 예측한 데이터를 다음 학습기가 학습함으로써 순차적으로 예측 정확도를 높여가는 점이 다르다. 그럼 카지노 꽁 머니 부스팅의 기본 개념과 작동원리에 알아보도록 하자.
카지노 꽁 머니 (카지노 꽁 머니)+ 카지노 꽁 머니 (Boosting)
선형회귀 알고리즘이 모델의 예측도를 높이기 위해 어떻게 최적의 가중치를 찾아갔는지 기억 나는가? 실제값과 예측값의 차이를 제곱해 평균한 평균제곱오차(MSE)를 손실함수로 하고 이 손실함수가 최소가 될 때 가설함수의 가중치를 경사하강법(카지노 꽁 머니 Descent)을 통해 찾았다.
경사하강법이란손실함수의 미분값의 크기가 점차 줄어드는 방향으로 가중치를 업데이트하며 손실함수의 최소값을 찾아가는 방법을 말한다. 이 때 손실함수를 미분하면 미분값은 예측값 - 실제값이 된다. 미분값(카지노 꽁 머니)이 양수이든 음수이든 손실함수의 최소값을 찾기 위해서는그 크기(기울기)가 점차 줄어드는 방향으로 이동해야 하는데, 이를 위해서는 카지노 꽁 머니에 마이너스를 취해 가중치를 업데이트해야 한다.
카지노 꽁 머니에 마이너스를 취하면실제값 - 예측값이 되는 데 이는 곧 잔차(residual)를 의미한다. 카지노 꽁 머니 부스팅은 선형회귀와 같은 작동방식은 아니지만 실제값과 예측값의 차이인 잔차를 학습해 나가며 잔차를 줄여나가는 방식이다. 즉, 이전 학습기의 잔차를 다음 학습기가 학습하고 학습기를 계속 추가해 가면서 잔차를 줄여가는 방식이다. 선형회귀 알고리즘에서 카지노 꽁 머니가 줄어들며 손실함수의 최소값을 찾아나가는 것과 같은원리에서 카지노 꽁 머니 부스팅 알고리즘으로 불린다.
“잔차를 줄여간다 = 카지노 꽁 머니(기울기)를 줄여간다”