大学ネットワーク

実践的な強化学習

説明

強化学習コースへようこそ。

ここであなたは以下について知るでしょう:

– RLメソッドの基礎:値/ポリシーの反復、q学習、ポリシーの勾配など。
—数学と電池が含まれています

–RLタスクにディープニューラルネットワークを使用する
—「誇大広告列車」としても知られています

–最先端のRLアルゴリズム
—そして実際の問題のためにそれらにダクトテープを貼る方法。

–そしてもちろん、ニューラルネットワークにゲームをプレイするように教える
—それがRLのことだと誰もが考えているからです。 seq2seqやコンテキストバンディットにも使用します。

飛び込んでください。楽しいでしょう!

技術的な問題はありますか? 私たちに書いてください:coursera@hse.ru

価格:無料で登録!

言語: 英語

字幕: 英語、韓国語

実践的な強化学習 –国立研究大学経済学部