이 번역 페이지는 최신 내용을 담고 있지 않습니다. 최신 내용을 영문으로 보려면 여기를 클릭하십시오.
MATLAB 환경
강화 학습 시나리오에서 환경은 에이전트가 상호 작용하는 동특성을 모델링합니다. 환경은 다음을 수행합니다.
에이전트로부터 행동을 받음
환경 모델의 동적 동작의 결과로 생성되는 관측값을 출력
특정 행동이 임무 달성에 얼마나 기여하는지 측정하는 보상을 생성
MATLAB에서 미리 정의된 환경과 사용자 지정 환경을 만들 수 있습니다. 자세한 내용은 MATLAB 강화 학습 환경 만들기 항목을 참조하십시오.
함수
도움말 항목
- MATLAB 강화 학습 환경 만들기
에이전트와 상호 작용하는 MATLAB 객체를 사용해 환경 동특성을 모델링하여 에이전트 행동에 대한 응답으로 보상 및 관측값을 생성합니다.
- 강화 학습 디자이너를 위한 MATLAB 환경 만들기
사용자 지정 MATLAB 환경을 가져오거나 미리 정의된 MATLAB 환경을 만듭니다.
- Define Reward Signals
Create a reward signal that measures how successful the agent is at achieving its goal.
- Load Predefined Control System Environments
Load predefined MATLAB control system environments.
- Load Predefined Grid World Environments
Train agents in predefined MATLAB grid world environments for which the actions, observations, and rewards are already defined.
- Create Custom Grid World Environments
Create custom MATLAB grid world environments by defining your own size, rewards and obstacles.
- 사용자 지정 함수를 사용하여 MATLAB 환경 만들기
사용자 지정 동적 함수를 제공하여 강화 학습 환경을 만듭니다.
- 템플릿에서 사용자 지정 MATLAB 환경 만들기
템플릿 환경 객체를 만들고 수정하여 사용자 지정 강화 학습 환경을 정의합니다.