データサイエンティストには、統計データ分析の方法に関する実際的かつ実践的な知識、数学モデルを構築するスキル(ニューラルネットワークからクラスタリング、因子から相関分析まで)、大規模なデータ配列の操作、およびパターンを見つける独自の能力が必要です。 しかし、これはすべての歌詞です。 さあ、ビジネスに取り掛かりましょう。
米国の平均給与はデータサイエンティスト-年間9万1千ドルです。 そして、ここに収入対仕事の経験のグラフがあります。
PayScaleデータ
ロシアでは、この数字は完全に「環境に優しい」初心者向けの月額6万〜7万ルーブルであり、経験豊富な専門家向けには220ルーブルです。
米国科学技術政策部の元シニアフェローであるDJ Patilによると、「データサイエンティストは、素晴らしい発見を実現し、素晴らしいストーリーを具現化するスキルのユニークなブレンドを持つスペシャリストです。すべてデータのおかげです。」
ビッグデータの専門家は本当に何をしているのですか? 彼らは常に技術的、方法論的、その他の制限に直面しており、新しいソリューションの方法を見つけています。 分析および予測することで発見します。 データサイエンスには創造性の場があります。専門家は複雑な問題に対するエレガントなソリューションを発明し、情報を定性的に視覚化し、テンプレートを理解しやすく説得力のあるものにします。
データサイエンティストの生涯からの例:「スタンフォードの物理学者であるジョナサントゴールドマンは、LinkedInソーシャルネットワークで仕事を得て、KPIで測定できなかったり、最終結果を見たりすることを始めました:サイト、バグの修正、機能の導入。 開発チームはサイトの近代化と訪問者の流入に対処する方法について困惑しましたが、ゴールドマンは、サイトの他のユーザーが精通している可能性のあるLinkedInアカウントの所有者に伝える予測モデルを構築しました。 同社の経営陣に新しいモデルをテストするよう説得したゴールドマンは、ソーシャルネットワークに何百万もの新しい見解をもたらし、成長を大幅に加速します。」
この職業の明確な説明はありません-それはすべて、データスキルの適用範囲に依存します。 ただし、 データサイエンティストが行うことは次のとおりです。
- 管理されていない大量のデータを収集し、それらをより便利な形式に変換します。
- データを使用してビジネス上の問題を解決します。
- SAS、R、 Pythonなど、さまざまなプログラミング言語を使用します。
- 統計テストや分布などの統計を操作します。
- 機械学習、深層学習、テキスト分析などの分析手法を使用します。
- ITおよびビジネスとの平等なコラボレーション。
- 順序とデータパターンを検索し、最終的なビジネス結果の達成に役立つ傾向を特定します。
そして、今後のデータサイエンティストが知っておくべき用語と技術は次のとおりです。
- データの視覚化 :データをグラフィカル形式で表示して、簡単に分析できるようにします。
- 機械学習:数学的アルゴリズムと自動化に基づく人工知能の分野。
- ディープラーニング:複雑な抽象化をモデル化するためにデータを使用する機械学習の研究分野。
- パターン認識:データ内のパターンを認識する技術(多くの場合、機械学習と交換可能に使用されます)。
- データ準備:生データを別の形式に変換して消費しやすくするプロセス。
- テキスト分析:非構造化データを分析して主要なビジネスアイデアを生成するプロセス。
とりわけ、次のことを理解して理解する必要があります。
- 統計と機械学習。
- SAS、R、またはPythonプログラミング言語 。
- MySQLおよびPostgresデータベース。
- データの視覚化とレポートテクノロジー。
- HadoopとMapReduce。
ここでは、ビーラインが彼女の会社のデータサイエンティストにインタビューする方法を読むことができます。「プロセスは、数学のいくつかの分野に関する質問を含む電話インタビューから始まります。 候補者の後、テストタスクが待機します-kaggle.comのタスクに類似した特定の機械学習タスク。 優れたアルゴリズムを構築し、テストサンプルの品質指標の高い値を受け取ったため、候補者は次の段階に進むことができます-機械学習方法とデータ分析の知識を確認し、実践と論理の問題から重要な質問を設定する直接インタビュー。
はい、データサイエンティストはゼロからではなく、適切なベースでアクセスできます。 大学を卒業した物理学者がビッグデータと科学を書いて交換したものは次のとおりです。「Bidgelyというオフィスは、年間13万ドルの給与(月額約7400ドル)でデータサイエンティストの職を提供してくれました。町のオフィスで働いています。 AppleのLinkedinのGoogle本社から数キロメートル離れたシリコンバレーのサニーベール。 1月に彼はデータサイエンスに行くべきだと考え、10月に米国で働き、6月に大学を卒業しました。
データサイエンティストは、多くのツールを使用して真の魔法を実行し、大量のデータを抽出および分析できるだけでなく、処理することもできる人であることをすでに理解しています。 データサイエンスを実際に行いたい場合は、 Excelだけでなく、数学的分析の教科書であるPythonの知識も習得して、学習の準備をしてください。
最後に、私たちはあなたを喜ばせたかっただけです。 便利なリンクをいくつか紹介します。 1つ目は、データサイエンスに関連する51 冊の無料の書籍です。 そして、ここが最大のデータサイエンスコミュニティです。 Machine LearningのPeter Flachによる優れた教科書もあります。 科学からデータから知識を抽出するアルゴリズムを構築する技術」、ロシア語に翻訳。
編集者から
データサイエンティストになりたい場合は、5か月間継続するフルタイムコースにサインアップすることをお勧めします。 トレーニング後、専門分野の「データアナリスト/機械学習スペシャリスト」の専門的な再トレーニングの卒業証書を受け取ります。 教師は、Yandex Data Factory、OWOX、Rambler、Sberbank-Technology、Microsoft、MTSなどの真の専門家です。 すべてのトレーニングは、理論だけでなく、必須の実践的なトレーニングにも基づいています。 したがって、フルタイムのコースを終えると、小売業者、銀行、スタートアップ、IT、テレコムなど、興味のあるあらゆる分野に行くことができる訓練された専門家として出てきます。 詳細はすべてこちらです。