Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

강화 학습

알려지지 않은 동적 환경과 상호 작용하여 심층 신경망 에이전트 훈련시키기

강화 학습은 에이전트가 알려지지 않은 동적 환경과 상호 작용하여 작업을 수행하는 방법을 학습하는 목표 지향 계산 방식입니다. 훈련 중에 학습 알고리즘은 에이전트 정책 파라미터를 업데이트합니다. 학습 알고리즘의 목표는 작업 중에 얻는 장기 보상을 극대화하는 최적의 정책을 찾는 것입니다.

에이전트 유형에 따라 정책은 하나 이상의 정책 및 가치 함수 표현식으로 표현됩니다. 심층 신경망을 사용하여 이러한 표현식을 구현할 수 있습니다. 그런 다음 Reinforcement Learning Toolbox™를 사용하여 이러한 신경망을 훈련시킬 수 있습니다.

자세한 내용은 Reinforcement Learning Using Deep Neural Networks 항목을 참조하십시오.

도움말 항목