買い物カゴに追加されました
買い物カゴに追加されました
カタログバナーリンク
オンライン授業リンク
ITエンジニアのための強化学習理論入門

ITエンジニアのための強化学習理論入門

3,278(税込)

数量


2020.7.15発売
中井悦司著
A5/296ページ
定価3278円(本体2980円+税10%)
ISBN:9784297115159

 

【この本の概要】

前作『IT エンジニアのための機械学習理論入門』は、教師あり学習(回帰問題、分類問題)と教師なし学習を中心とした、機械学習の基礎的なアルゴリズムを理論面からわかりやすく解説した内容でした。今回のテーマである強化学習は、これらと同じ機械学習の一分野で す が 、環境内を動き回るエージェントを利用して、データの収集と学習処理を並行して行うというユニークな特徴があ り ま す 。最近では、強化学習にニューラルネットワークを組み合わせた手法も研究が進んでいます。本書では、まず、環境の変化を記述する「環境モデル」 の理解が 前提として完全解を得るためのアルゴリズムを解説します。その後、環境モデルがわからない場合の学習手法である「 SARSA 」や「 Q Learning 」を説明します。そしてニューラルネットワークで行動価値関数を推定する方法(DQN)を解説します。強化学習の応用により、自動車の自動運転システムや、囲碁将棋ゲーム AI など、さまざまな分野での活用が期待されています。 なお、使用 す る プログラミング 言語 は、 前作 同様 Python 。 ソースコードは、GitHubにあり、 本文中のサンプル プログラムを自由 試せます。