無料のオンライン教育

高次元データ解析

説明

あなたがデータ分析と解釈に興味があるなら、これはあなたのためのデータサイエンスコースです。 距離の数学的定義を学習することから始め、これを使用して、次元削減と多次元尺度構成法のための特異値分解(SVD)の使用と、主成分分析への接続を動機付けます。 バッチ効果について学習します。これは、今日のゲノミクスで最も困難なデータ分析の問題であり、この手法を使用してバッチ効果を検出および調整する方法について説明します。 具体的には、主成分分析と因子分析について説明し、これらの概念がハイスループット実験データのデータ視覚化とデータ分析にどのように適用されるかを示します。 最後に、機械学習について簡単に紹介し、それを高スループットデータに適用します。 クラスタリング分析の背後にある一般的な考え方を説明し、K-meansと階層的クラスタリングを説明し、これらがゲノミクスでどのように使用されるかを示し、トレーニングセット、テストセット、エラー率、クロスの概念とともにk最近傍法などの予測アルゴリズムについて説明します。検証。 学生の学歴の多様性を考慮して、シリーズを2つのパートに分けました。 興味のあるシリーズ全体または個々のコースを受講できます。 統計学者の場合は、最初の525.1つまたは525.2つのコースをスキップすることを検討する必要があります。同様に、生物学者の場合は、生物学の入門講義の一部をスキップすることを検討する必要があります。 クラスの統計とプログラミングの側面は、最初の525.3つのコースで比較的急速に難易度が上がることに注意してください。 525.4番目のコースでは、階層モデルなどの高度な統計概念を教え、525.5番目のコースでは、並列コンピューティングや再現可能な研究概念などの高度なソフトウェアエンジニアリングスキルを学びます。 これらのコースは525.6つのXSeriesを構成し、自分のペースで進められます。PH525.7x:ライフサイエンスの統計とR PH25x:線形モデルと行列代数の概要PH114818x:高スループット実験の統計的推論とモデリングPHXNUMXx :高次元データ分析PHXNUMXx:バイオコンダクター入門:ゲノムとゲノムアッセイの注釈と分析PHXNUMXx:再現可能なゲノミクスの高性能コンピューティングPHXNUMXx:機能ゲノミクスのケーススタディこのクラスはNIHによって部分的にサポートされましたRXNUMXGMXNUMXを付与します。  

価格: 監査は無料です!

ハーバード大学とMITによって設立された教育用プラットフォームであるedXによる高次元データ分析。

高次元データ解析