強化学習の基礎| 大学ネットワーク

説明

強化学習は機械学習のサブフィールドですが、自動意思決定とAIの汎用的な形式でもあります。このコースでは、エージェントが明示的に行動を起こして世界と対話する統計学習手法を紹介します。インタラクティブエージェントやインテリジェントな意思決定に関心を寄せる企業が増えている現在、意思決定を行う学習エージェントの重要性と課題を理解することは、今日非常に重要です。

このコースでは、強化学習の基本を紹介します。このコースを修了すると、次のことができるようになります。
–マルコフ決定過程として問題を形式化する
–基本的な探査方法と探査/探査のトレードオフを理解する
–最適な意思決定のための汎用ツールとしての価値関数を理解する
–産業用制御問題への効率的なソリューションアプローチとして動的計画法を実装する方法を知っている

このコースでは、強化学習の主要な概念、RLの基礎となる古典的アルゴリズムと現代的アルゴリズムの基礎を学びます。このコースを完了すると、実際の問題に対してRLを使用できるようになります。MDPがあるか、MDPを指定できます。

これは、強化学習スペシャライゼーションの最初のコースです。