rlQAgent
Q-러닝 강화 학습 에이전트
설명
Q-러닝 알고리즘은 모델이 주어지지 않은(model-free) 온라인 방식의 오프-폴리시(off-policy) 강화 학습 방법입니다. Q-러닝 에이전트는 가치를 기반으로 하는 강화 학습 에이전트로, 리턴값 또는 미래 보상을 추정하도록 크리틱을 훈련시킵니다.
Q-러닝 에이전트에 대한 자세한 내용은 Q-러닝 에이전트 항목을 참조하십시오.
다양한 유형의 강화 학습 에이전트에 대한 자세한 내용은 Reinforcement Learning Agents 항목을 참조하십시오.
생성
설명
는 지정된 크리틱 신경망을 갖는 Q-러닝 에이전트를 만들고 agent
= rlQAgent(critic
,agentOptions
)AgentOptions
속성을 설정합니다.
입력 인수
속성
객체 함수
train | Train reinforcement learning agents within a specified environment |
sim | Simulate trained reinforcement learning agents within specified environment |
getAction | Obtain action from agent or actor given environment observations |
getActor | Get actor from reinforcement learning agent |
setActor | Set actor of reinforcement learning agent |
getCritic | Get critic from reinforcement learning agent |
setCritic | Set critic of reinforcement learning agent |
generatePolicyFunction | Create function that evaluates trained policy of reinforcement learning agent |