강화 학습
이 시리즈는 전통적 기법으론 풀기 어려운 제어 시스템 문제를 풀 수 있는 머신러닝의 한 유형인 강화 학습에 대한 개요를 제공합니다.
강화 문제의 기본 사항과 전통적인 제어 기법과의 차이점을 다룹니다. 알 수 없는 함수를 나타내는 데 신경망이 사용되는 이유와 에이전트가 환경으로부터 수집된 보상을 신경망 훈련에 사용하는 방법을 보여줍니다.
이 시리즈를 완료하면 여러분은 다음과 같은 질문에 더 잘 대답할 수 있을 것입니다.
- 강화 학습이란 무엇이며, 제어 문제를 풀 때 왜 이를 고려해야 할까요?
- 강화 학습 문제를 어떻게 설정하고 풀 수 있나요?
- 전통적인 제어 접근 방식에 비해 강화 학습에는 어떤 이점과 단점이 있나요?
엔지니어의 관점에서 강화학습에 대해 전반적으로 살펴볼 수 있습니다. 강화학습은 매우 까다로운 제어 문제를 해결할 잠재력을 지닌 일종의 머신러닝입니다.
이 비디오에서는 워크플로를 살펴봄으로써 강화 학습에 대한 기본적인 이해를 쌓을 수 있습니다. 환경이란 무엇일까요? 보상 함수는 어떻게 에이전트에 인센티브를 제공할까요? 정책은 어떻게 구성될까요?
강화 학습 알고리즘 및 신경망 정책에 대한 개요입니다.
로보틱스, 특히 이족 보행 로봇에 대한 강화 학습 응용 사례입니다.
프로덕션 시스템에 강화 학습을 사용할 때에 몇 가지 현실적인 과제가 발생하며, 이를 완화할 수 있는 방법들도 존재합니다. 이 비디오에서는 학습된 해결책을 검증하는 데 따르는 어려움과 이를 어떻게 해결할 수 있는지를 다룹니다.
다중 에이전트 강화 학습이 무엇이고 어떤 어려움이 있으며 또 이를 극복할 수 있는지 알아볼 수 있습니다.
모델 없는 강화 학습과 모델 기반 강화 학습의 접근법을 비교하고 상황에 따라 어떤 방법을 사용할지에 대한 더 깊은 이해를 얻을 수 있습니다.
다양한 접근 방식을 통한 강화 학습을 사용해 하드웨어에서 제어 정책을 훈련시키고 배포하는 방법을 알아볼 수 있습니다.