Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

훈련 및 시뮬레이션

강화 학습 에이전트 훈련 및 시뮬레이션하기

훈련이 진행되는 동안 에이전트는 주어진 환경에 대한 최적의 정책을 학습하기 위해 파라미터를 계속해서 업데이트합니다. 시뮬레이션 중에 에이전트는 환경으로부터 관측값과 보상을 받고, 파라미터 업데이트 없이 행동을 환경으로 반환합니다.

Reinforcement Learning Toolbox™는 시뮬레이션을 통해 에이전트를 훈련하고 훈련 결과를 검증하는 함수를 제공합니다. 에이전트 훈련 및 시뮬레이션에 대한 소개는 강화 학습 에이전트 훈련시키기 항목을 참조하십시오.

강화 학습 디자이너강화 학습 에이전트 설계, 훈련 및 시뮬레이션 (R2021a 이후)

함수

모두 확장

trainTrain reinforcement learning agents within a specified environment
rlTrainingOptionsOptions for training reinforcement learning agents
rlMultiAgentTrainingOptionsOptions for training multiple reinforcement learning agents (R2022a 이후)
trainWithEvolutionStrategyTrain DDPG, TD3 or SAC agent using an evolutionary strategy within a specified environment (R2023b 이후)
rlEvolutionStrategyTrainingOptionsOptions for training off-policy reinforcement learning agents using an evolutionary strategy (R2023b 이후)
inspectTrainingResult(Not recommended) Plot training information from a previous training session (R2021a 이후)
trainFromDataTrain off-policy reinforcement learning agent using existing data (R2023a 이후)
rlTrainingFromDataOptionsOptions to train reinforcement learning agents using existing data (R2023a 이후)
inspectTrainingResult(Not recommended) Plot training information from a previous training session (R2021a 이후)
rlEvaluatorOptions for evaluating reinforcement learning agents during training (R2023b 이후)
rlCustomEvaluatorCustom object for evaluating reinforcement learning agents during training (R2023b 이후)
rlDataLoggerCreate either a file logger object or a monitor logger object to log training data (R2022b 이후)
rlDataViewerOpen Reinforcement Learning Data Viewer tool (R2023a 이후)
FileLoggerLog reinforcement learning training data to MAT-files (R2022b 이후)
MonitorLoggerLog reinforcement learning training data to monitor window (R2022b 이후)
trainingProgressMonitorMonitor and plot training progress for deep learning custom training loops (R2022b 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
storeStore data in the internal memory of a (file or monitor) logger object (R2022b 이후)
writeTransfer stored data from the internal logger memory to the logging target (R2022b 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)
simSimulate trained reinforcement learning agents within specified environment
rlSimulationOptionsOptions for simulating a reinforcement learning agent within an environment
rlReplayMemoryReplay memory experience buffer (R2022a 이후)
rlPrioritizedReplayMemoryReplay memory experience buffer with prioritized sampling (R2022b 이후)
rlHindsightReplayMemoryHindsight replay memory experience buffer (R2023a 이후)
rlHindsightPrioritizedReplayMemoryHindsight replay memory experience buffer with prioritized sampling (R2023a 이후)
appendAppend experiences to replay memory buffer (R2022a 이후)
sampleSample experiences from replay memory buffer (R2022a 이후)
resize재생 메모리 경험 버퍼의 크기 조정 (R2022b 이후)
allExperiencesReturn all experiences in replay memory buffer (R2022b 이후)
validateExperienceValidate experiences for replay memory (R2023a 이후)
generateHindsightExperiencesGenerate hindsight experiences from hindsight experience replay buffer (R2023a 이후)
rlOptimizerCreates an optimizer object for actors and critics (R2022a 이후)
runEpisodeSimulate reinforcement learning environment against policy or agent (R2022a 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)
FutureObject that supports deferred outputs for reinforcement learning environment simulations running on workers (R2022a 이후)
fetchNextRetrieve next available unread outputs from a reinforcement learning environment simulations running on workers (R2022a 이후)
fetchOutputsRetrieve results from all reinforcement learning environment simulations running on workers (R2022a 이후)
cancelCancel unfinished reinforcement learning environment simulations on workers (R2022a 이후)
waitWait for reinforcement learning environment simulations running on a workers to finish (R2022a 이후)

블록

RL Agent강화 학습 에이전트
Policy강화 학습 정책 (R2022b 이후)

도움말 항목

훈련 및 시뮬레이션 기본 사항

강화 학습 디자이너 앱 사용하기

훈련 및 시뮬레이션 고급 사항

다중 프로세스 및 GPU 사용하기

다중 에이전트 훈련

사용자 지정 에이전트 및 훈련 알고리즘 개발하기

모델 기반의 정책 최적화 에이전트 훈련시키기