大学ネットワーク

データサイエンスコンペティションに勝つ方法:トップカグラーから学ぶ

説明

競争力のあるデータサイエンスを学びたい場合は、このコースが最適です。 予測モデリングコンペティションに参加することで、信用、保険、マーケティング、自然言語処理、販売予測、コンピュータービジョンなど、さまざまな分野での実践的な経験を積み、データモデリングスキルを向上させて活用できます。 同時に、何千人もの参加者が最も予測可能なアルゴリズムを構築しようとする競争の中で、それを実現できます。 お互いを限界まで押し上げると、パフォーマンスが向上し、予測エラーが小さくなる可能性があります。 一貫して高いランクを達成できることは、データサイエンスでのキャリアを加速するのに役立ちます。

このコースでは、このような予測モデリングタスクを競争力のある方法で分析および解決する方法を学びます。

このクラスを終了すると、次のことができるようになります。

–予測モデリングの競合を効率的に解決する方法を理解し、取得したスキルのどれを実際のタスクに適用できるかを学びます。
–データを前処理し、テキストや画像などのさまざまなソースから新しい機能を生成する方法を学びます。
–予測を改善する手段として、平均エンコーディングの生成、集計された統計的測定の使用、最近傍法の検索などの高度な機能エンジニアリング手法を学びます。
–ソリューションのベンチマークを行い、観察されていない(テスト)データでテストした場合の過剰適合または過適合を回避するのに役立つ、信頼性の高い相互検証手法を形成できます。
–データの分析と解釈の経験を積む。 不整合、高ノイズレベル、エラー、およびリークなどの他のデータ関連の問題に気づき、それらを克服する方法を学びます。
–さまざまなアルゴリズムの知識を習得し、ハイパーパラメータを効率的に調整して最高のパフォーマンスを実現する方法を学びます。
–さまざまな機械学習モデルを組み合わせる技術を習得し、アンサンブルする方法を学びます。
–過去の(勝利した)ソリューションとコードに触れ、それらの読み方を学びます。

免責事項:これは一般的な意味での機械学習コースではありません。 このコースでは、何千もの競合他社に対して上位のソリューションを取得する方法について、それらの背後にある理論的な基盤ではなく、機械学習手法の実践的な使用に焦点を当てて学習します。

受験資格:
– Python:パンダでDataFrameを操作し、matplotlibで図をプロットし、scikit-learn、XGBoost、LightGBMからモデルをインポートしてトレーニングします。
–機械学習:線形モデル、K-NN、ランダムフォレスト、勾配ブースティング、ニューラルネットワークの基本的な理解。

技術的な問題はありますか? 私たちに書いてください:coursera@hse.ru

価格:無料で登録!

言語: 英語

字幕: 英語、韓国語

データサイエンスコンペティションに勝つ方法:トップカグラーから学ぶ –国立研究大学経済学部