Main Content

훈련 및 검증

강화 학습 에이전트 훈련 및 시뮬레이션하기

강화 학습 에이전트는 최적의 정책을 학습하기 위해 반복적인 시행착오 과정을 거치면서 환경과 상호 작용합니다. 에이전트는 훈련이 진행되는 동안 정책 표현의 파라미터를 조정하여 장기 보상을 최대화합니다. Reinforcement Learning Toolbox™는 시뮬레이션을 통해 에이전트를 훈련하고 훈련 결과를 검증하는 함수를 제공합니다. 자세한 내용은 강화 학습 에이전트 훈련시키기 항목을 참조하십시오.

강화 학습 디자이너강화 학습 에이전트 설계, 훈련 및 시뮬레이션

함수

모두 확장

trainTrain reinforcement learning agents within a specified environment
rlTrainingOptionsOptions for training reinforcement learning agents
rlMultiAgentTrainingOptionsOptions for training multiple reinforcement learning agents
inspectTrainingResultPlot training information from a previous training session
rlDataLoggerCreates either a file logger object or a monitor logger object to log training data
FileLoggerLog reinforcement learning training data to MAT files
MonitorLoggerLog reinforcement learning training data to monitor window
trainingProgressMonitorMonitor and plot training progress for deep learning custom training loops
setupSet up reinforcement learning environment or initialize data logger object
storeStore data in the internal memory of a (file or monitor) logger object
writeTransfer stored data from the internal logger memory to the logging target
cleanupClean up reinforcement learning environment or data logger object
simSimulate trained reinforcement learning agents within specified environment
rlSimulationOptionsOptions for simulating a reinforcement learning agent within an environment
runEpisodeSimulate reinforcement learning environment against policy or agent
setupSet up reinforcement learning environment or initialize data logger object
cleanupClean up reinforcement learning environment or data logger object

블록

RL Agent강화 학습 에이전트
PolicyReinforcement learning policy

도움말 항목

훈련 및 시뮬레이션 기본 사항

강화 학습 디자이너 앱 사용하기

다중 프로세스 및 GPU 사용하기

이중 적분기 시스템을 제어하도록 에이전트 훈련시키기

카트-폴 시스템의 균형을 유지하도록 에이전트 훈련시키기

진자가 위쪽으로 똑바로 서서 균형을 유지하도록 에이전트 훈련시키기

다중 에이전트 훈련

제어 사양에서 보상 생성하기

모방 학습

로봇을 제어하도록 에이전트 훈련시키기

제어 작업을 수행하도록 에이전트 훈련시키기

자동차 응용 사례를 위한 에이전트 훈련시키기

기타 응용 사례

사용자 지정 에이전트 및 훈련 알고리즘 개발하기

에이전트 및 정책 배포하기