Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

훈련 및 검증

강화 학습 에이전트 훈련 및 시뮬레이션하기

강화 학습 에이전트는 최적의 정책을 학습하기 위해 반복적인 시행착오 과정을 거치면서 환경과 상호 작용합니다. 에이전트는 훈련이 진행되는 동안 정책 표현의 파라미터를 조정하여 장기 보상을 최대화합니다. Reinforcement Learning Toolbox™는 시뮬레이션을 통해 에이전트를 훈련하고 훈련 결과를 검증하는 함수를 제공합니다. 자세한 내용은 강화 학습 에이전트 훈련시키기 항목을 참조하십시오.

강화 학습 디자이너강화 학습 에이전트 설계, 훈련 및 시뮬레이션 (R2021a 이후)

함수

모두 확장

trainTrain reinforcement learning agents within a specified environment (R2019a 이후)
rlTrainingOptionsOptions for training reinforcement learning agents (R2019a 이후)
rlMultiAgentTrainingOptionsOptions for training multiple reinforcement learning agents (R2022a 이후)
trainFromDataTrain off-policy reinforcement learning agent using existing data (R2023a 이후)
rlTrainingFromDataOptionsOptions to train reinforcement learning agents using existing data (R2023a 이후)
inspectTrainingResultPlot training information from a previous training session (R2021a 이후)
rlDataLoggerCreate either a file logger object or a monitor logger object to log training data (R2022b 이후)
rlDataViewerOpen Reinforcement Learning Data Viewer tool (R2023a 이후)
FileLoggerLog reinforcement learning training data to MAT-files (R2022b 이후)
MonitorLoggerLog reinforcement learning training data to monitor window (R2022b 이후)
trainingProgressMonitorMonitor and plot training progress for deep learning custom training loops (R2022b 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
storeStore data in the internal memory of a (file or monitor) logger object (R2022b 이후)
writeTransfer stored data from the internal logger memory to the logging target (R2022b 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)
simSimulate trained reinforcement learning agents within specified environment (R2019a 이후)
rlSimulationOptionsOptions for simulating a reinforcement learning agent within an environment (R2019a 이후)
runEpisodeSimulate reinforcement learning environment against policy or agent (R2022a 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)
FutureObject that supports deferred outputs for reinforcement learning environment simulations running on workers (R2022a 이후)
fetchNextRetrieve next available unread outputs from a reinforcement learning environment simulations running on workers (R2022a 이후)
fetchOutputsRetrieve results from all reinforcement learning environment simulations running on workers (R2022a 이후)
cancelCancel unfinished reinforcement learning environment simulations on workers (R2022a 이후)
waitWait for reinforcement learning environment simulations running on a workers to finish (R2022a 이후)

블록

RL Agent강화 학습 에이전트 (R2019a 이후)
PolicyReinforcement learning policy (R2022b 이후)

도움말 항목

훈련 및 시뮬레이션 기본 사항

강화 학습 디자이너 앱 사용하기

다중 프로세스 및 GPU 사용하기

다중 에이전트 훈련

이중 적분기 시스템을 제어하도록 에이전트 훈련시키기

카트-폴 시스템의 균형을 유지하도록 에이전트 훈련시키기

진자가 위쪽으로 똑바로 서서 균형을 유지하도록 에이전트 훈련시키기

제어 작업을 수행하도록 에이전트 훈련시키기

로봇을 제어하도록 에이전트 훈련시키기

제어 사양에서 보상 생성하기

모방 학습

자동차 응용 사례를 위한 에이전트 훈련시키기

기타 응용 사례

사용자 지정 에이전트 및 훈련 알고리즘 개발하기

에이전트 및 정책 배포하기