강화 학습은 컴퓨터 에이전트가 역동적인 환경에서 반복적인 시행착오 상호 작용을 통해 작업 수행 방법을 학습하는 머신러닝 기법의 한 유형입니다.
이 eBook은 여러분이 강화 학습을 시작할 수 있도록 용어를 설명하고 예제, 튜토리얼 및 추가 참고 자료에 대한 액세스를 제공합니다. 보상 및 정책 구조에서 훈련 및 배포에 이르기까지 여러분이 알아야 할 모든 내용을 다룹니다.
다음과 같은 사항에 대해 배울 수 있습니다.
- 강화 학습 문제의 기본 사항 및 전통적인 제어 기법과의 차이점
- 정책 기반, 가치 기반, 액터-크리틱 방법 등 다양한 유형의 훈련 알고리즘
- Q-러닝을 위한 벨만 방정식을 포함한 각 훈련 방법의 장단점
- 지도 학습, 비지도 학습, 그리고 강화 학습의 차이점
- 훈련된 정책을 배포하기 전에 고려해야 할 점 및 이 기법과 관련된 전반적인 장단점