強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
曽我部 東馬, 電気通信大学
オーム社, 2019
ISBN: 9784274223716;
言語: 日本語
平均という初歩的な数学を入口として、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては MATLAB のコードを配布しており、コードを実行することで「原理→数式→プログラム」という一連の流れを直感的に把握できます。
本書の特徴
- 難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説
- さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較
웹사이트 선택
번역된 콘텐츠를 보고 지역별 이벤트와 혜택을 살펴보려면 웹사이트를 선택하십시오. 현재 계신 지역에 따라 다음 웹사이트를 권장합니다:
또한 다음 목록에서 웹사이트를 선택하실 수도 있습니다.
사이트 성능 최적화 방법
최고의 사이트 성능을 위해 중국 사이트(중국어 또는 영어)를 선택하십시오. 현재 계신 지역에서는 다른 국가의 MathWorks 사이트 방문이 최적화되지 않았습니다.
미주
- América Latina (Español)
- Canada (English)
- United States (English)
유럽
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)