強化学習におけるエピ​ソード数の変数として​の取得方法

強化学習用のコードを書いている途中で、
ε-greedy法の設定を以下のようにしたいと考えています。
if episode<400
agentOptions.EpsilonGreedyExploration=(episode*(-0.00125)+0.5+0.05)
end
↑は、εを0.5から0.05へ、一次関数的に減衰させることを目的としたコードです。
ここで、エピソード数を変数として取得するにはどのようにすればよろしいでしょうか。
初歩的な質問で大変恐縮ですが、
教えていただけますと幸いです。

 채택된 답변

Hiro Yoshino
Hiro Yoshino 2020년 10월 20일

0 개 추천

train関数を使って学習させる場合は、episodeから都度変更することは出来ないと思われます。
agentOptions.EpsilonDecay % 減衰率
agentOptions.EpsilonMin % 最小のepsilon値
で非線形に小さくなっていきます。

댓글 수: 3

Y. M
Y. M 2020년 10월 21일
ご解説いただきありがとうございます。
その際のεの設定は、示していただいた式を
agentOptions.Epsilon=
で入力すればよろしいのでしょうか。
Hiro Yoshino
Hiro Yoshino 2020년 10월 21일
何のアルゴリズムを使うかで、agentのオプションは当然ことなります
Q-learningなら
から調べてください。
インスタンスを作るタイミングでもepsilonは設定できますし、あとから設定することもできます。
Q-agentの場合は、
agentOptions.Epsilon = 0.1;
のように設定できます。
Y. M
Y. M 2020년 10월 21일
ありがとうございます。
頂いた助言をもとに何とかやってみたいと思います。

댓글을 달려면 로그인하십시오.

추가 답변 (0개)

질문:

2020년 10월 20일

댓글:

2020년 10월 21일

Community Treasure Hunt

Find the treasures in MATLAB Central and discover how the community can help you!

Start Hunting!