환경

강화 학습 환경의 동특성 및 출력값 모델링

강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 월드를 모델링합니다.

Reinforcement Learning Toolbox™는 미리 정의된 객체를 제공하여 다양한 벤치마크 환경을 구현하도록 합니다. 환경 동특성에 대한 사용자 지정 함수를 사용하거나 기존 환경 템플릿 클래스를 수정하거나 Simulink^® 모델을 사용하여, 자신만의 고유한 환경을 만들 수도 있습니다.

강화 학습 환경에 대한 소개는 Reinforcement Learning Environments 항목을 참조하십시오.

함수

모두 확장

환경 인터페이스

`rlFiniteSetSpec`	유한 집합 행동 또는 관측값 채널에 대한 사양 객체 만들기
`rlNumericSpec`	숫자형 행동 또는 관측값 채널에 대한 사양 객체 만들기
`getActionInfo`	강화 학습 환경, 에이전트 또는 경험 버퍼에서 행동 데이터 사양 가져오기
`getObservationInfo`	강화 학습 환경, 에이전트 또는 경험 버퍼에서 관측값 데이터 사양 가져오기
`validateEnvironment`	Validate custom reinforcement learning environment
`bus2RLSpec`	Create reinforcement learning data specifications for elements of a Simulink bus

그리드 월드 환경과 MDP 환경

`createGridWorld`	강화 학습을 위한 2차원 그리드 월드 만들기
`createMDP`	마르코프 결정 과정 모델 만들기
`rlMDPEnv`	강화 학습을 위한 마르코프 결정 과정 환경 만들기

미리 정의된 환경

rlPredefinedEnv 미리 정의된 강화 학습 환경 만들기

보상 계산

`generateRewardFunction`	Generate a reward function from control specifications to train a reinforcement learning agent (R2021b 이후)
`exteriorPenalty`	경계가 지정된 영역에 대한 점의 외부 벌점 값 (R2021b 이후)
`hyperbolicPenalty`	Hyperbolic penalty value for a point with respect to a bounded region (R2021b 이후)
`barrierPenalty`	경계가 지정된 영역에 대한 점의 로그 장벽 벌점 값 (R2021b 이후)

사용자 지정 환경

`rlFunctionEnv`	재설정 함수와 스텝 함수를 사용하여 사용자 지정 강화 학습 환경 만들기
`rlMultiAgentFunctionEnv`	Create custom multiagent reinforcement learning environment (R2023b 이후)
`rlTurnBasedFunctionEnv`	Create custom turn-based multiagent reinforcement learning environment (R2023b 이후)
`rlCreateEnvTemplate`	사용자 지정 강화 학습 환경 템플릿 만들기
`rlSimulinkEnv`	이미 에이전트와 환경을 포함한 Simulink 모델에서 환경 객체를 만듭니다.
`createIntegratedEnv`	Create environment object from a Simulink environment model that does not contain an agent block
`SimulinkEnvWithAgent`	Simulink에서 구현된 동적 모델을 사용하는 강화 학습 환경
`bus2RLSpec`	Create reinforcement learning data specifications for elements of a Simulink bus
`validateEnvironment`	Validate custom reinforcement learning environment

신경망 환경

`rlNeuralNetworkEnvironment`	Environment model with deep neural network transition models (R2022a 이후)
`rlContinuousDeterministicTransitionFunction`	Deterministic transition function approximator object for neural network-based environment (R2022a 이후)
`rlContinuousGaussianTransitionFunction`	Stochastic Gaussian transition function approximator object for neural network-based environment (R2022a 이후)
`rlContinuousDeterministicRewardFunction`	Deterministic reward function approximator object for neural network-based environment (R2022a 이후)
`rlContinuousGaussianRewardFunction`	Stochastic Gaussian reward function approximator object for neural network-based environment (R2022a 이후)
`rlIsDoneFunction`	Is-done function approximator object for neural network-based environment (R2022a 이후)
`predict`	Predict next observation, next reward, or episode termination given observation and action input data (R2022a 이후)
`evaluate`	Evaluate function approximator object given observation (or observation-action) input data (R2022a 이후)
`accelerate`	신경망에 기반한 근사기 객체의 기울기 계산 속도를 높이는 옵션 (R2022a 이후)

환경 설정, 재설정 및 정리

`reset`	Reset environment, agent, experience buffer, or policy object (R2022a 이후)
`setup`	Set up reinforcement learning environment or initialize data logger object (R2022a 이후)
`cleanup`	Clean up reinforcement learning environment or data logger object (R2022a 이후)

블록

RL Agent

강화 학습 에이전트

도움말 항목

강화 학습 환경에 대한 소개

Reinforcement Learning Environments
Model environment dynamics using a MATLAB^® object that generates rewards and observations in response to agents actions.

그리드 월드 환경

Load Predefined Grid World Environments
Load grid world environments in which the actions, observations, and rewards are already defined.
Create Custom Grid World Environments
Create custom grid world environments by defining your own grid size, rewards and obstacles.

미리 정의된 제어 시스템 환경

Load Predefined Control System Environments
Load predefined environments used as benchmarks for control systems design.

사용자 지정 MATLAB 환경

Define Reward and Observation Signals in Custom Environments
Create a reward signal that measures how successfully the agent actions are achieving a goal.
Create Custom Environment Using Step and Reset Functions
Create reinforcement learning environments by supplying custom step and reset functions.
클래스 템플릿에서 사용자 지정 환경 만들기
템플릿 환경 클래스를 수정하여 사용자 지정 강화 학습 환경을 만듭니다.

사용자 지정 Simulink 환경

Define Reward and Observation Signals in Custom Environments
Create a reward signal that measures how successfully the agent actions are achieving a goal.
Create Custom Simulink Environments
Create a custom environment using a Simulink model that generates rewards and observations in response to agents actions.
물탱크 강화 학습 환경 모델
탱크 수위 제어기의 역할을 하는 RL 에이전트가 포함되어 있는 강화 학습 Simulink 환경을 만듭니다.

강화 학습 디자이너에서 환경 불러오기

강화 학습 디자이너에서 MATLAB 환경 불러오기
강화 학습 디자이너 앱에서 MATLAB 환경을 불러옵니다.
강화 학습 디자이너에서 Simulink 환경 불러오기
강화 학습 디자이너 앱에서 Simulink 환경을 불러옵니다.