書評みたいなことは書きませんが、小生がじっくり読んで学んだ「強化学習」の参考書は以下の2点でした。
[1] 中井悦司, ITエンジニアのための強化学習理論入門, 技術評論社、2020-7-30初版
[2] 伊藤 真, Pythonで強化学習を学ぶ, 日経ソフトウェア2021年7月号, pp. 24-39
本日(2021-11-20)、Amazonに予約してあった下記の新刊が到着しました!
上記[2]の記事を書かれた伊藤真氏による新著です。また、学ぶ楽しみが増えました。
[3] 伊藤 真, 「強化学習」を学びたい人最初に読む本, 日経BP, 2021-11-22初版
本書は、タイトルは控えめになっていますが、かなり高度な内容も含まれます。しかし、そこを一歩一歩丁寧に叙述しているのが最大の特徴のようです。
Q-Learningにおいて、Qテーブルをダイナミックプログラミングで(厳密解を)求解するという基本線はもちろんです。それに加えて、ニューラルネットワークを利用する近似解法とその性能検討、さらにその向上策にも、じっくり取組んでいます。
中井氏の[1]と伊藤氏の[3]は、ともに、丁寧な叙述で、かなり高度なところまで導いてくれる素晴らしい本だと思います。具体的なコードもフォローしやすく、広範な読者層に向いていると思います。
これら以外にもいくつか強化学習の和書や訳本は出版されていますが、小生の知る限りでは、内容がやや古かったり、最新技術に言及しているがやや理論寄りだったり、難解な感じで少しとっつきにくいものが多いように思っていました。そのなかで、[1]と[3]が出版されたのは非常に喜ばしいところです。
上記[1], [2]を学んで自分で確認したり、再構成したり、応用アプリにしたりの記事をこのブログに数編づつ書いて来ました。今回の新著[3]についても、学んだあと、同様に、自分なりの確認や応用について書ければよいと思っています。
0 件のコメント:
コメントを投稿