주요 콘텐츠

강화 학습

알려지지 않은 동적 환경과 상호 작용하여 심층 신경망 에이전트 훈련시키기

강화 학습은 에이전트가 알려지지 않은 동적 환경과 상호 작용하여 작업을 수행하는 방법을 학습하는 목표 지향 계산 학습 방식입니다. 이 학습 알고리즘은 훈련하는 동안 에이전트 정책 파라미터를 업데이트합니다. 학습 알고리즘의 목표는 작업을 수행하면서 받는 누적 감가 장기 보상의 기대치를 극대화하는 최적의 정책을 찾는 것입니다.

이 학습 방식에서는 사람의 개입 없이 그리고 목표 달성을 위한 명시적인 프로그래밍 없이도 에이전트가 작업의 누적 보상을 극대화하기 위한 일련의 결정을 내릴 수 있습니다. Reinforcement Learning Toolbox™를 사용하여 강화 학습 에이전트를 만들고 훈련시킬 수 있습니다.

자세한 내용은 강화 학습이란? (Reinforcement Learning Toolbox) 항목을 참조하십시오.

도움말 항목

추천 예제