Main Content

이 페이지의 내용은 이전 릴리스에 관한 것입니다. 해당 영문 페이지는 최신 릴리스에서 제거되었습니다.

Simulink 환경

Simulink® 모델을 사용하여 강화 학습 환경 동특성 모델링하기

강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 동특성을 모델링합니다. 환경은 다음을 수행합니다.

  1. 에이전트로부터 행동을 받음

  2. 환경 모델의 동적 동작의 결과로 생성되는 관측값을 출력

  3. 특정 행동이 임무 달성에 얼마나 기여하는지 측정하는 보상을 생성

Simulink 모델을 사용하여 미리 정의된 환경과 사용자 지정 환경을 만들 수 있습니다. 자세한 내용은 Simulink 강화 학습 환경 만들기 항목을 참조하십시오.

함수

모두 확장

rlPredefinedEnv미리 정의된 강화 학습 환경 만들기 (R2019a 이후)
rlSimulinkEnvSimulink에서 구현된 동적 모델을 사용하여 강화 학습 환경 만들기 (R2019a 이후)
createIntegratedEnvCreate environment object from a Simulink environment model that does not contain an agent block (R2019a 이후)
validateEnvironmentValidate custom reinforcement learning environment (R2019a 이후)
SimulinkEnvWithAgentSimulink에서 구현된 동적 모델을 사용하는 강화 학습 환경 (R2019a 이후)
generateRewardFunctionGenerate a reward function from control specifications to train a reinforcement learning agent (R2021b 이후)
exteriorPenaltyExterior penalty value for a point with respect to a bounded region (R2021b 이후)
hyperbolicPenaltyHyperbolic penalty value for a point with respect to a bounded region (R2021b 이후)
barrierPenalty경계가 지정된 영역에 대한 점의 로그 장벽 벌점 값 (R2021b 이후)
rlFiniteSetSpec강화 학습 환경에 대한 이산 행동 또는 관측값 데이터 사양 만들기 (R2019a 이후)
rlNumericSpec강화 학습 환경에 대한 연속 행동 또는 관측값 데이터 사양 만들기 (R2019a 이후)
getActionInfoObtain action data specifications from reinforcement learning environment, agent, or experience buffer (R2019a 이후)
getObservationInfo강화 학습 환경, 에이전트 또는 경험 버퍼에서 관측값 데이터 사양 가져오기 (R2019a 이후)
bus2RLSpecCreate reinforcement learning data specifications for elements of a Simulink bus (R2019a 이후)
resetReset environment, agent, experience buffer, or policy object (R2022a 이후)
setupSet up reinforcement learning environment or initialize data logger object (R2022a 이후)
cleanupClean up reinforcement learning environment or data logger object (R2022a 이후)

블록

RL Agent강화 학습 에이전트 (R2019a 이후)

도움말 항목