주요 콘텐츠

정책 배포

코드 생성 및 훈련된 정책 배포

강화 학습 에이전트를 훈련시킨 후, 코드를 만들어 최적 정책을 배포할 수 있습니다. 예를 들어, MATLAB® Coder™와 GPU Coder™를 사용하여 C++ 또는 CUDA® 코드를 생성하고 내장 플랫폼에 신경망 정책을 배포할 수 있습니다.

정책을 기반으로 코드를 생성하는 방법에 대한 개요는 Generate Code from Trained Reinforcement Learning Policies 항목을 참조하십시오. 배포된 정책의 훈련에 대한 개요는 Examine Approaches to Fine Tune a Deployed Policy 항목을 참조하십시오.

함수

generatePolicyFunctionGenerate MATLAB function that evaluates policy of an agent or policy object
generatePolicyBlockGenerate Simulink block that evaluates policy of an agent or policy object (R2022b 이후)
policyParametersObtain structure of policy parameters to update policy during simulation or deployment (R2025a 이후)
updatePolicyParametersUpdate policy according to structure of policy parameters given as input argument (R2025a 이후)

블록

Policy강화 학습 정책 (R2022b 이후)

도움말 항목

추천 예제