Main Content

이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.

rlPredefinedEnv

미리 정의된 강화 학습 환경 만들기

설명

예제

env = rlPredefinedEnv(keyword)는 환경 이름을 나타내는 미리 정의된 키워드 keyword를 받아 MATLAB® 또는 Simulink® 강화 학습 환경 env를 만듭니다. 환경 env는 에이전트가 상호 작용하는 동특성을 모델링하여 에이전트 행동에 대한 응답으로 보상과 관측값을 생성합니다.

예제

모두 축소

미리 정의된 "BasicGridWorld" 키워드를 사용하여 기본 그리드 월드 강화 학습 환경을 만듭니다.

env = rlPredefinedEnv("BasicGridWorld")
env = 
  rlMDPEnv with properties:

       Model: [1x1 rl.env.GridWorld]
    ResetFcn: []

미리 정의된 "DoubleIntegrator-Continuous" 키워드를 사용하여 연속 이중 적분기 강화 학습 환경을 만듭니다.

env = rlPredefinedEnv("DoubleIntegrator-Continuous")
env = 
  DoubleIntegratorContinuousAction with properties:

             Gain: 1
               Ts: 0.1000
      MaxDistance: 5
    GoalThreshold: 0.0100
                Q: [2x2 double]
                R: 0.0100
         MaxForce: Inf
            State: [2x1 double]

plot 함수를 사용하여 환경을 시각화하고 resetstep 함수를 사용하여 환경과 상호 작용할 수 있습니다.

plot(env)
observation = reset(env)
observation = 2×1

     4
     0

[observation,reward,isDone] = step(env,16)

Figure Double Integrator Visualizer contains an axes object. The axes object contains an object of type rectangle.

observation = 2×1

    4.0800
    1.6000

reward = -16.5559
isDone = logical
   0

미리 정의된 "SimplePendulumModel-Continuous" 키워드를 사용하여 연속 단진자 모델 강화 학습 환경을 만듭니다.

env = rlPredefinedEnv("SimplePendulumModel-Continuous")
env = 
SimulinkEnvWithAgent with properties:

           Model : rlSimplePendulumModel
      AgentBlock : rlSimplePendulumModel/RL Agent
        ResetFcn : []
  UseFastRestart : on

입력 인수

모두 축소

환경 이름을 나타내는 미리 정의된 키워드로, 다음 중 하나로 지정됩니다.

MATLAB 환경

  • 'BasicGridWorld'

  • 'CartPole-Discrete'

  • 'CartPole-Continuous'

  • 'DoubleIntegrator-Discrete'

  • 'DoubleIntegrator-Continuous'

  • 'SimplePendulumWithImage-Discrete'

  • 'SimplePendulumWithImage-Continuous'

  • 'WaterFallGridWorld-Stochastic'

  • 'WaterFallGridWorld-Deterministic'

Simulink 환경

  • 'SimplePendulumModel-Discrete'

  • 'SimplePendulumModel-Continuous'

  • 'CartPoleSimscapeModel-Discrete'

  • 'CartPoleSimscapeModel-Continuous'

출력 인수

모두 축소

MATLAB 또는 Simulink 환경 객체로, 다음 중 하나로 반환됩니다.

  • 다음 키워드 중 하나를 사용할 경우 rlMDPEnv 객체.

    • 'BasicGridWorld'

    • 'WaterFallGridWorld-Stochastic'

    • 'WaterFallGridWorld-Deterministic'

  • 'CartPole-Discrete' 키워드를 사용할 경우 CartPoleDiscreteAction 객체.

  • 'CartPole-Continuous' 키워드를 사용할 경우 CartPoleContinuousAction 객체.

  • 'DoubleIntegrator-Discrete' 키워드를 사용할 경우 DoubleIntegratorDiscreteAction 객체.

  • 'DoubleIntegrator-Continuous' 키워드를 사용할 경우 DoubleIntegratorContinuousAction 객체.

  • 'SimplePendulumWithImage-Discrete' 키워드를 사용할 경우 SimplePendlumWithImageDiscreteAction 객체.

  • 'SimplePendulumWithImage-Continuous' 키워드를 사용할 경우 SimplePendlumWithImageContinuousAction 객체.

  • 다음 키워드 중 하나를 사용할 경우 SimulinkEnvWithAgent 객체.

    • 'SimplePendulumModel-Discrete'

    • 'SimplePendulumModel-Continuous'

    • 'CartPoleSimscapeModel-Discrete'

    • 'CartPoleSimscapeModel-Continuous'

버전 내역

R2019a에 개발됨