説明
強化学習コースへようこそ。
ここであなたは以下について知るでしょう:
– RLメソッドの基礎:値/ポリシーの反復、q学習、ポリシーの勾配など。
—数学と電池が含まれています
–RLタスクにディープニューラルネットワークを使用する
—「誇大広告列車」としても知られています
–最先端のRLアルゴリズム
—そして実際の問題のためにそれらにダクトテープを貼る方法。
–そしてもちろん、ニューラルネットワークにゲームをプレイするように教える
—それがRLのことだと誰もが考えているからです。 seq2seqやコンテキストバンディットにも使用します。
飛び込んでください。楽しいでしょう!
技術的な問題はありますか? 私たちに書いてください:coursera@hse.ru
価格:無料で登録!
言語: 英語
字幕: 英語、韓国語