photo


Last seen: 1년 초과 전 2024년부터 활동

Followers: 0   Following: 0

통계

MATLAB Answers

1 질문
0 답변

순위
93,287
of 300,857

평판
0

참여
1 질문
0 답변

답변 채택
0.0%

획득한 표
0

순위
 of 21,097

평판
N/A

평균 평점
0.00

참여
0 파일

다운로드 수
0

ALL TIME 다운로드 수
0

순위

of 171,361

참여
0 문제
0 답안

점수
0

배지 수
0

참여
0 게시물

참여
0 공개 채널

평균 평점

참여
0 하이라이트

평균 좋아요 수

Feeds

보기 기준

질문


我再使用强化学习工具箱编写SAC智能体进行训练时策略一直在上下限波动,没有很好的探索,而使用DDPG智能体和PPO智能体则是能够进行一些有效的探索,请问这是什么原因?
%main % 观测空间和动作空间定义 % numObs = 11; %观测空间维度 % numAct = 4;%动作空间维度 numObs1 = 7; %观测空间维度 numAct1 = 3;%动作空间维度 %BS, EB, ,CL a...

1년 초과 전 | 답변 수: 1 | 0

1

답변