データサイエンス:ラングリング

データサイエンス:ラングリング

製品説明

このコースでは、データサイエンスのプロフェッショナル認定プログラムの一環として、Rへのデータのインポート、データの整理、文字列処理、HTML解析、日付と時刻の操作、テキストマイニングなど、データラングリングプロセスのいくつかの標準的な手順について説明します。 XNUMX回の分析でこれらすべてのラングリング手順が必要になることはめったにありませんが、データサイエンティストは、ある時点でこれらすべてに直面する可能性があります。 データサイエンスプロジェクトでデータに簡単にアクセスできることはめったにありません。 データは、ファイルやデータベースにあるか、Webページ、ツイート、PDFなどのドキュメントから抽出されている可能性が高くなります。 このような場合、最初のステップは、データをRにインポートし、tidyverseパッケージを使用してデータを整理することです。 データを生の形式から整頓された形式に変換するステップは、データラングリングと呼ばれます。 このプロセスは、データサイエンティストにとって重要なステップです。 データを整理してクリーンアップする方法を知っていると、他の方法では隠されていた重要な洞察を得ることができます。

価格:$ 49 –監査は無料です!

データサイエンス:ハーバード大学とMITによって設立された教育用プラットフォームであるedXに精通しています。

データサイエンス:ラングリング –ハーバードX