2021-08-11から1日間の記事一覧

【5分講義・深層強化学習#2】DQN手法を用いたAlphaGOその後の進化

以前の記事では、深層強化学習、そしてその代表的な手法であるDQNについて紹介しました。 gri-blog.hatenablog.com 深層強化学習以前のゲームAIは、以下を使ったものが主流でした。 探索木 ルールベースAI: 「相手がこう打ったらこう打つべきだ」に従うルー…

【5分講義・深層強化学習#1】深層強化学習そしてDQN手法、何が強いのか

この記事では、従来の強化学習の延長上に研究が進められてきた深層強化学習について、従来の強化学習に対する改善点、技術の進化、課題などを述べていきます。 まず、「強化学習」についてはじめて学ぶ方のために、簡単に一言説明: 教師あり学習と教師なし…