Reinforcement Learning Toolbox

 

Reinforcement Learning Toolbox

강화 학습을 사용한 정책 설계 및 훈련

강화 학습 에이전트

DQN, PPO, SAC 등 널리 사용되는 알고리즘을 사용하여 모델 없는 강화 학습 에이전트 및 모델 기반 강화 학습 에이전트를 생성할 수 있습니다. 제공되는 템플릿을 사용하여 사용자 지정 알고리즘을 개발할 수도 있습니다. 강화 학습 에이전트 블록을 사용하면 에이전트를 Simulink로 가져올 수 있습니다.

강화 학습 디자이너 앱

대화형 방식으로 강화 학습 에이전트를 설계, 훈련, 시뮬레이션할 수 있습니다. 향후 사용 및 배포를 위해 훈련된 에이전트를 MATLAB으로 내보낼 수 있습니다.

보상 신호

에이전트의 목표 달성 수준을 측정하는 보상 신호를 생성할 수 있습니다. Model Predictive Control Toolbox 또는 Simulink Design Optimization에 정의된 제어 사양에서 보상 함수를 자동으로 생성할 수 있습니다.

정책 표현

툴박스에서 제안하는 신경망 아키텍처를 사용하여 빠르게 시작할 수 있습니다. Deep Learning Toolbox 레이어와 심층 신경망 디자이너 앱을 사용하여 룩업 테이블을 탐색하거나 직접 신경망 정책을 정의할 수도 있습니다.

강화 학습 훈련

환경과 상호 작용하는 방식으로 또는 기존 데이터를 사용하여 에이전트를 훈련시킬 수 있습니다. 단일 에이전트 및 다중 에이전트 훈련에 대해 알아볼 수 있습니다. 훈련 데이터를 기록 및 확인하고 진행 상황을 모니터링할 수 있습니다.

분산 연산

Parallel Computing ToolboxMATLAB Parallel Server를 사용하면 멀티코어 컴퓨터, 클라우드 리소스 또는 연상 클러스터를 사용하여 훈련 속도를 높일 수 있습니다. GPU를 활용하여 기울기 계산 및 예측 등의 작업을 가속화할 수 있습니다.

환경 모델링

MATLABSimulink를 사용하여 강화 학습 에이전트와 원활하게 상호 작용하는 환경을 모델링할 수 있습니다. 타사 모델링 툴과 연동할 수 있습니다.

코드 생성 및 배포

임베디드 기기에 배포하기 위한 C/C++ 및 CUDA 코드를 훈련된 정책에서 자동으로 생성할 수 있습니다. MATLAB Compiler 및 MATLAB Production Server를 사용하여 훈련된 정책을 프로덕션 시스템에 독립 실행형 응용 프로그램, C/C++ 공유 라이브러리 등으로 배포할 수 있습니다.

참조 예제

로보틱스, 자율 주행, 보정, 스케줄링 및 기타 응용 사례를 위한 제어기와 의사결정 알고리즘을 설계할 수 있습니다. 참조 예제를 학습하여 바로 시작해 보세요.

"5G는 악의적인 공격으로부터 반드시 보호해야 하는 매우 중요한 인프라입니다. Reinforcement Learning Toolbox를 사용하면 빠르게 5G 취약점을 평가하고 완화 방법을 파악할 수 있습니다."

Ambrose Kam, Lockheed Martin

무료 평가판 받기

30일 동안 사용해 보세요.


구입할 준비가 되었나요?

가격을 확인하고 관련 제품을 살펴보세요.

학생이세요?

Campus-Wide License를 통해 이미 귀하의 학교에서 MATLAB, Simulink 및 그 밖의 애드온 제품에 대한 사용 권한을 제공하고 있을 수 있습니다.