Main Content

강화 학습

알려지지 않은 동적 환경과 상호 작용하여 심층 신경망 에이전트 훈련시키기

강화 학습은 에이전트가 알려지지 않은 동적 환경과 상호 작용하여 작업을 수행하는 방법을 학습하는 목표 지향 계산 방식입니다. 훈련 중에 학습 알고리즘은 에이전트 정책 파라미터를 업데이트합니다. 학습 알고리즘의 목표는 작업 중에 얻는 장기 보상을 극대화하는 최적의 정책을 찾는 것입니다.

에이전트 유형에 따라 정책은 하나 이상의 정책 및 가치 함수 표현식으로 표현됩니다. 심층 신경망을 사용하여 이러한 표현식을 구현할 수 있습니다. 그런 다음 Reinforcement Learning Toolbox™를 사용하여 이러한 신경망을 훈련시킬 수 있습니다.

자세한 내용은 Reinforcement Learning Using Deep Neural Networks 항목을 참조하십시오.

도움말 항목