
強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
曽我部 東馬, 電気通信大学
オーム社, 2019
ISBN: 9784274223716;
言語: 日本語
平均という初歩的な数学を入口として、「価値」「探索」「マルコフ性」といった強化学習の基本をわかりやすく解説します。また、各アルゴリズムについては、「多腕バンディット問題」および「グリッドワールド問題」のいずれかを用いて、比較しやすい状態で解説します。そのため、各アルゴリズムの特徴や差異がわかりやすくなっています。さらに、中核的なアルゴリズムについては MATLAB のコードを配布しており、コードを実行することで「原理→数式→プログラム」という一連の流れを直感的に把握できます。
本書の特徴
- 難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説
- さまざまなアルゴリズムを、共通する例題を用いて特徴がわかりやすいように比較
Select a Web Site
Choose a web site to get translated content where available and see local events and offers. Based on your location, we recommend that you select: .
You can also select a web site from the following list
How to Get Best Site Performance
Select the China site (in Chinese or English) for best site performance. Other MathWorks country sites are not optimized for visits from your location.
Americas
- América Latina (Español)
- Canada (English)
- United States (English)
Europe
- Belgium (English)
- Denmark (English)
- Deutschland (Deutsch)
- España (Español)
- Finland (English)
- France (Français)
- Ireland (English)
- Italia (Italiano)
- Luxembourg (English)
- Netherlands (English)
- Norway (English)
- Österreich (Deutsch)
- Portugal (English)
- Sweden (English)
- Switzerland
- United Kingdom (English)