강화 학습
강화 학습은 에이전트가 알려지지 않은 동적 환경과 상호 작용하여 작업을 수행하는 방법을 학습하는 목표 지향 계산 방식입니다. 훈련 중에 학습 알고리즘은 에이전트 정책 파라미터를 업데이트합니다. 학습 알고리즘의 목표는 작업 중에 얻는 장기 보상을 극대화하는 최적의 정책을 찾는 것입니다.
에이전트 유형에 따라 정책은 하나 이상의 정책 및 가치 함수 표현식으로 표현됩니다. 심층 신경망을 사용하여 이러한 표현식을 구현할 수 있습니다. 그런 다음 Reinforcement Learning Toolbox™를 사용하여 이러한 신경망을 훈련시킬 수 있습니다.
자세한 내용은 Reinforcement Learning Using Deep Neural Networks 항목을 참조하십시오.
도움말 항목
- Reinforcement Learning Using Deep Neural Networks
Reinforcement learning is a goal-directed computational approach where a computer learns to perform a task by interacting with an unknown dynamic environment.
- Control Water Level in a Tank Using a DDPG Agent
Train a controller using reinforcement learning with a plant modeled in Simulink® as the training environment.
- Create DQN Agent Using Deep Network Designer and Train Using Image Observations
Create a reinforcement learning agent using the Deep Network Designer app from the Deep Learning Toolbox™.
- Train DDPG Agent to Swing Up and Balance Pendulum with Image Observation
Train a reinforcement learning agent using an image-based observation signal.
- Train DQN Agent for Lane Keeping Assist Using Parallel Computing
Train a reinforcement learning agent for a lane keeping assist application.
- Imitate MPC Controller for Lane Keeping Assist
Train a deep neural network to imitate the behavior of a model predictive controller.