Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

환경

강화 학습 환경의 동특성 및 출력값 모델링

강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 월드를 모델링합니다.

Reinforcement Learning Toolbox™는 미리 정의된 객체를 제공하여 다양한 벤치마크 환경을 구현하도록 합니다. 환경 동특성에 대한 사용자 지정 함수를 사용하거나 기존 환경 템플릿 클래스를 수정하거나 Simulink® 모델을 사용하여, 자신만의 고유한 환경을 만들 수도 있습니다.

강화 학습 환경에 대한 소개는 Reinforcement Learning Environments 항목을 참조하십시오.

함수

모두 확장

rlFiniteSetSpec유한 집합 행동 또는 관측값 채널에 대한 사양 객체 만들기
rlNumericSpec숫자형 행동 또는 관측값 채널에 대한 사양 객체 만들기
getActionInfo강화 학습 환경, 에이전트 또는 경험 버퍼에서 행동 데이터 사양 가져오기
getObservationInfo강화 학습 환경, 에이전트 또는 경험 버퍼에서 관측값 데이터 사양 가져오기
validateEnvironmentValidate custom reinforcement learning environment
bus2RLSpecCreate reinforcement learning data specifications for elements of a Simulink bus
createGridWorld강화 학습을 위한 2차원 그리드 월드 만들기
createMDP마르코프 결정 과정 모델 만들기
rlMDPEnv강화 학습을 위한 마르코프 결정 과정 환경 만들기
rlPredefinedEnv미리 정의된 강화 학습 환경 만들기
generateRewardFunctionGenerate a reward function from control specifications to train a reinforcement learning agent (R2021b 이후)
exteriorPenalty경계가 지정된 영역에 대한 점의 외부 벌점 값 (R2021b 이후)
hyperbolicPenaltyHyperbolic penalty value for a point with respect to a bounded region (R2021b 이후)
barrierPenalty경계가 지정된 영역에 대한 점의 로그 장벽 벌점 값 (R2021b 이후)
rlFunctionEnv재설정 함수와 스텝 함수를 사용하여 사용자 지정 강화 학습 환경 만들기
rlMultiAgentFunctionEnvCreate custom multiagent reinforcement learning environment (R2023b 이후)
rlTurnBasedFunctionEnvCreate custom turn-based multiagent reinforcement learning environment (R2023b 이후)
rlCreateEnvTemplate사용자 지정 강화 학습 환경 템플릿 만들기
rlSimulinkEnv이미 에이전트와 환경을 포함한 Simulink 모델에서 환경 객체를 만듭니다.
createIntegratedEnvCreate environment object from a Simulink environment model that does not contain an agent block
SimulinkEnvWithAgentSimulink에서 구현된 동적 모델을 사용하는 강화 학습 환경
bus2RLSpecCreate reinforcement learning data specifications for elements of a Simulink bus
validateEnvironmentValidate custom reinforcement learning environment
rlNeuralNetworkEnvironmentEnvironment model with deep neural network transition models (R2022a 이후)
rlContinuousDeterministicTransitionFunctionDeterministic transition function approximator object for neural network-based environment (R2022a 이후)
rlContinuousGaussianTransitionFunctionStochastic Gaussian transition function approximator object for neural network-based environment (R2022a 이후)
rlContinuousDeterministicRewardFunctionDeterministic reward function approximator object for neural network-based environment (R2022a 이후)
rlContinuousGaussianRewardFunctionStochastic Gaussian reward function approximator object for neural network-based environment (R2022a 이후)
rlIsDoneFunctionIs-done function approximator object for neural network-based environment (R2022a 이후)
predictPredict next observation, next reward, or episode termination given observation and action input data (R2022a 이후)
evaluateEvaluate function approximator object given observation (or observation-action) input data (R2022a 이후)
accelerate신경망에 기반한 근사기 객체의 기울기 계산 속도를 높이는 옵션 (R2022a 이후)
resetReset environment, agent, experience buffer, or policy object (R2022a 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)

블록

RL Agent강화 학습 에이전트

도움말 항목

강화 학습 환경에 대한 소개

그리드 월드 환경

미리 정의된 제어 시스템 환경

사용자 지정 MATLAB 환경

사용자 지정 Simulink 환경

강화 학습 디자이너에서 환경 불러오기