createMDP
마르코프 결정 과정 객체 만들기
설명
마르코프 결정 과정(MDP)은 상태와 관측값이 유한한 공간에 속하고 상태 천이가 확률적 규칙을 따르는 이산시간 확률 제어 과정입니다. MDP는 강화 학습을 사용하여 해결된 최적화 문제를 연구하는 데 유용합니다. createMDP
함수를 사용하여 지정된 상태와 천이를 갖는 GenericMDP
객체를 만들 수 있습니다. 그런 다음 객체의 속성 중 일부를 수정하고 이 객체를 rlMDPEnv
에 전달하여 에이전트가 상호 작용할 수 있는 환경을 만들 수 있습니다.
예제
입력 인수
출력 인수
버전 내역
R2019a에 개발됨