強化学習の学習済み方策の転移について

Question

0 개 추천

お世話になります。

強化学習(DQN)の学習済み方策を別の制御モデルに転移させる時、学習済みのQ-Networkを転移させることは可能でしょうか。

また、転移学習の例題では最終層以外の層の学習率を0にすることで最終層以外の重みを凍結させていましたが、一部の層の重みのみを凍結することは可能でしょうか。

댓글 수: 0
이전 댓글 -2개 표시 이전 댓글 -2개 숨기기

Answer 1

Hiro Yoshino 2021년 8월 2일

1 개 추천

やったことが無いのですが、可能だと思います。

DQN なので、rlQValueRepresentation で学習済みのネットワークを渡せば良いと思います。

また、学習済みのネットワークを追加で学習する際に、一部のレイヤーの一部のパラメータの学習率をコントロールすることが任意で可能です。setLearnRateFactor で任意のパラメータの学習係数を指定できます。

これにグローバルの学習率が掛け合わさって、そのパラメータの学習率になります。従って、これを使ってゼロを設定すれば、そのパラメータは学習において更新されません。