챕터 4

지도 학습 적용


지도 학습을 고려해야 하는 경우

지도 학습 알고리즘은 알려진 입력 데이터셋(훈련 세트)과 그 데이터에 대한 알려진 응답 변수(출력값)로 모델을 훈련하여 새로운 입력 데이터에 대한 응답 변수에 맞는 합리적인 예측 변수를 생성합니다. 예측하려는 출력값에 대해 기존 데이터가 있다면 지도 학습을 사용할 수 있습니다.

모든 지도 학습 기법은 분류 또는 회귀의 한 형태입니다.

비디오 길이: 4:35

분류 기법은 예를 들어 이메일이 진짜인지 스팸인지 또는 종양의 크기가 작은지, 중간인지, 큰지와 같은 이산 응답 변수를 예측합니다. 분류 모델은 데이터를 범주로 분류하도록 훈련됩니다. 응용 사례로는 의료 영상, 음성 인식, 신용 평가 등이 있습니다.

회귀 기법은 예를 들어 온도 변화 또는 전기 수요의 변동과 같은 연속 응답 변수를 예측합니다. 응용 사례로는 주가 예측, 손글씨 인식, 음향 신호 처리 등이 있습니다.

올바른 알고리즘 선택

챕터 1에서 살펴본 것처럼 머신러닝 알고리즘을 선택하는 것은 시행착오를 거치는 과정입니다. 아래와 같은 알고리즘의 특정 특징 간에는 상충관계가 존재하기도 합니다.

  • 훈련 속도
  • 메모리 사용량 
  • 새로운 데이터에 대한 예측 정확도
  • 투명성 또는 해석 가능성 (알고리즘의 예측에 대한 이유를 쉽게 이해할 수 있는 정도)

일반적인 분류 알고리즘

일반 회귀 알고리즘