深層強化学習

【5分講義・深層強化学習#2】DQN手法を用いたAlphaGOその後の進化

以前の記事では、深層強化学習、そしてその代表的な手法であるDQNについて紹介しました。 gri-blog.hatenablog.com 深層強化学習以前のゲームAIは、以下を使ったものが主流でした。 探索木 ルールベースAI: 「相手がこう打ったらこう打つべきだ」に従うルー…

【5分講義・深層強化学習#1】深層強化学習そしてDQN手法、何が強いのか

この記事では、従来の強化学習の延長上に研究が進められてきた深層強化学習について、従来の強化学習に対する改善点、技術の進化、課題などを述べていきます。 まず、「強化学習」についてはじめて学ぶ方のために、簡単に一言説明: 教師あり学習と教師なし…

【5分講義・深層強化学習#4】A3Cの手法の中身と性能を理解

以前の記事ではA3Cアルゴリズムを紹介しました。エージェントの非同期な学習を特徴とし、学習の高速化と安定かの効果があります。 gri-blog.hatenablog.com 今回この記事では、A3Cの学習法をさらに詳しく解説し、他の深層強化学習の手法と比べた性能をお伝え…

【5分講義・深層強化学習#3】今ホットなA3Cアルゴリズム

強化学習、そして強化学習をディープラーニングと組み合わせた深層強化学習は、AIを学ぶ上での難題の1つです。本記事では、強化学習の学習法のイメージを持っていただくために、強化学習の数多くのアルゴリズムの中でも有名なA3C(Asynchronous Advantage A…