完全な強化学習システム（Capstone）| 大学ネットワーク

説明

この最後のコースでは、コース1、2、および3の知識をまとめて、問題に対する完全なRLソリューションを実装します。このキャップストーンを使用すると、問題の定式化、アルゴリズムの選択、パラメーターの選択、表現の設計などの各コンポーネントが完全なソリューションにどのように適合するか、およびRLを現実の世界に展開するときに適切な選択を行う方法を確認できます。このプロジェクトでは、問題を刺激する環境と、ニューラルネットワーク関数近似を使用した制御エージェントの両方を実装する必要があります。さらに、学習システムの科学的研究を実施して、RLエージェントの堅牢性を評価する能力を開発します。現実の世界でRLを使用するには、（a）問題をMDPとして適切に形式化し、（b）適切なアルゴリズムを選択し、（c）実装のどの選択がパフォーマンスに大きな影響を与えるかを特定し、（d）検証することが重要です。アルゴリズムの予想される動作。このキャップストーンは、RLを使用して実際の問題を解決することを計画している人にとって価値があります。

このコースで成功するには、このスペシャライゼーションのコース1、2、および3または同等のコースを完了している必要があります。

このコースの終わりまでに、あなたはできるようになるでしょう：

問題の定式化、適切なアルゴリズムの選択と実装、およびソリューションの有効性に関する実証的研究から始めて、問題に対するRLソリューションを完成させます。