이 페이지의 내용은 이전 릴리스에 관한 것입니다. 해당 영문 페이지는 최신 릴리스에서 제거되었습니다.
Simulink 환경
Simulink® 모델을 사용하여 강화 학습 환경 동특성 모델링하기
강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 동특성을 모델링합니다. 환경은 다음을 수행합니다.
에이전트로부터 행동을 받음
환경 모델의 동적 동작의 결과로 생성되는 관측값을 출력
특정 행동이 임무 달성에 얼마나 기여하는지 측정하는 보상을 생성
Simulink 모델을 사용하여 미리 정의된 환경과 사용자 지정 환경을 만들 수 있습니다. 자세한 내용은 Simulink 강화 학습 환경 만들기 항목을 참조하십시오.
함수
블록
RL Agent | 강화 학습 에이전트 (R2019a 이후) |
도움말 항목
- Simulink 강화 학습 환경 만들기
에이전트와 상호 작용하는 Simulink 모델을 사용해 환경 동특성을 모델링하여 에이전트 행동에 대한 응답으로 보상 및 관측값을 생성합니다.
- 강화 학습 디자이너에서 Simulink 환경 만들기 또는 가져오기
사용자 지정 Simulink 환경을 가져오거나 미리 정의된 Simulink 환경을 만듭니다.
- Define Reward and Observation Signals in Custom Environments
Create a reward signal that measures how successfully the agent actions are achieving a goal.
- 물탱크 강화 학습 환경 모델
탱크 수위 제어기의 역할을 하는 RL 에이전트가 포함되어 있는 강화 학습 Simulink 환경을 만듭니다.