データサイエンススキル





労働市場におけるスキルの需要に関する一連の分析研究を続けています。 今回はPavel Surmenk sharkyのおかげで、新しい職業であるデータサイエンティストを検討します。



近年、データサイエンスという用語が人気を集め始めています。 彼らはこれについて多くのことを書き、会議で話しています。 一部の企業では、データサイエンティストという名誉ある称号を持つ人材を雇用しています。 データサイエンスとは そして、データサイエンティストは誰ですか?





データサイエンティストとは誰ですか?



サンフランシスコの居住者にそのような質問をすると、データサイエンティストはサンフランシスコに住む統計学者であるという答えを得ることができます。 サンフランシスコに住んでいない人にとってはあまり励みにはなりませんが、面白いですね。 それでは、別の定義:データサイエンティストは、どのプログラマよりも優れた統計を知っており、どの統計よりも優れた知識を持っている人です。 しかし、このオプションはすでにポイントに近づいています。 データサイエンティストであるデータサイエンティストは、統計とプログラマーの一種のハイブリッドです。 さらに、統計学者とプログラマーは非常に異なっているため、この職業は純粋な統計学者から純粋なプログラマーまでの広い範囲と考える方が良いです。



TwitterのデータサイエンティストであるRobert Changは、自分の職業を2つのグループに分けています。 タイプAのデータサイエンティストとタイプBのデータサイエンティストです。



タイプA(Aは分析)。 これらの人々は、主に静的データから意味を抽出することに従事しています。 彼らは統計学者に非常に似ており、統計学者であり、役職をデータサイエンティストに変更することさえできます。 しかし、統計とは別に、データを消去する方法、大規模なデータセットを操作する方法、データを視覚化し、その結果を説明する方法など、実用的な側面も知っています。



タイプB、ここでBは建物です。 統計の知識もありますが、同時に強力で経験豊富なプログラマーもいます。 彼らは実際のシステムでデータを使用することにもっと興味を持っています。 多くの場合、ユーザーと連携して機能するモデル、たとえば商品、映画、広告の推奨システムを構築します。



データサイエンスは、タイプBデータサイエンスに近い機械学習や人工知能などの分野ともわずかに重複しています。



データサイエンティストのスキル



英語圏のインターネットでは、2012年頃からデータサイエンスへの関心が高まっている傾向がよく見られます( https://www.google.com/trends/explore#q=Data%20Science )。 過去数年間で、機械学習、人工知能、深層学習などの関連分野への関心も著しく高まっています。 Gartnerは、2015年にMachine Learningを誇大広告の頂点に位置付けました。 ガートナーの2015年の新興技術の誇大広告サイクルは、組織が監視すべきコンピューティングイノベーションを特定します。 Harvard Business Reviewは、2012年に興味深い見出しの記事「 データサイエンティスト:21世紀の最もセクシーな仕事」を公開しました。











それでは、データサイエンティストになりたい人は、どのようなスキルが必要かを何を学ぶのでしょうか? アメリカの雇用主がデータサイエンスと機械学習の分野でのポジションの候補者に対して行った要件を見てみましょう。



世界最大の求人検索ポータルの1つであるMonster.comに投稿された549の求人を分析しました。これには、データサイエンスと機械学習の要件が含まれていました。



データサイエンティストのハードスキル



まず、ハードスキルの要件を分析します。



ランキングからわかるように、最も人気のあるのは、数学、統計、コンピューターサイエンス、機械学習の基本的な知識です。 理論的な知識に加えて、データサイエンティストはデータを「マイニング」、精製、モデリング、視覚化できる必要があります。 ソフトウェア開発と品質管理の経験も重要です。











データサイエンスツールとテクノロジー



Data Scientistの主なツールは、プログラミング言語PythonおよびRです。



Rは統計計算専用のプログラミング言語です。そのため、統計学者やデータ科学者は非常に好きです。 データセットをすばやくロードし、基本的な統計特性を計算し、データを視覚化し、データモデルを構築できます。



Pythonは汎用プログラミング言語ですが、データサイエンスと機械学習のための膨大な数の高品質のライブラリとプラットフォームを備えています。



空室の39%で、RとPythonの両方の知識が同時に必要であるため、両方の言語を一度に学習し、どちらかを選択しようとしない方が良いことは注目に値します。



ビッグデータを扱う場合、雇用主はHadoopとSparkを使用することを好みます。 データベースの中で、MySQLとMongoDBが一般的です。











データサイエンティストのソフトスキル



職業スキルと比較すると、一般的な能力(ソフトスキル)は、空席で2倍以上も言及されているため、需要が少なくなります。 ソフトスキルが必要な空席の平均給与も大幅に低く、ハードスキルとテクノロジーの知識が必要な場合よりも約20%低くなっています。



ただし、遭遇するソフトスキルの中で最も重要なのは、コミュニケーション、データの視覚化、プレゼンテーションの作成、文章の作成、効果的な発話の能力です。 チームワーク、管理、問題解決のスキルも役立ちます。











データサイエンティストドメインの知識



一部の空席には、物理​​学や生物学から不動産、ホテル事業まで、対象分野の知識が必要です。 リーダーは経済学、マーケティング、医学です。











データサイエンティストの専門分野



調査を開始する前に、データサイエンティストの専門分野の下位専門分野を強調するつもりでした。 たとえば、主にデータの分析と視覚化に携わる人を、予測分析または機械学習アルゴリズムのモデルを構築する人から分離するため。 しかし、データの分析中に判明したように、ほとんどの空席の要件は非常に均一であり、専門分野への明確な内訳はありません。



いくつかのパターンは興味深いようですが。 たとえば、欠員がPythonまたはC ++の知識を必要とする場合、コミュニケーションスキルと管理の要件はほとんどありません。逆の場合も同様です。



給与に対するテクノロジーの影響



O'Reilly 2015 Data Science Salary Survey調査は、反対側から労働市場を見るのに役立ちます。 この調査は600人のデータサイエンティストの調査に基づいており、収集されたデータには、給与レベル、人口統計情報、および専門家がさまざまなタイプのタスクに費やす時間が含まれています。 この研究の主な調査結果は次のとおりです。





レポート全体を読むことをお勧めします。 とりわけ、彼は、データサイエンティストの給料がどこに住んでいるか、どのような教育を受けているか、どのタスクに取り組んでいるかについての数学モデルについて説明しています。 たとえば、会議に多くの時間を費やすデータサイエンティストは、より多くの収入を得ます。 また、1日4時間以上データを学習する人は、収入が少なくなります。



データサイエンスの学習方法



近年、このトピックに関する多くのオンラインコースが登場しています。 そして、これは非常に良い開始方法です!



あなたがデータ分析にもっと傾いているなら、良い選択肢はCourseraのData Science専門コースです: Data Scienceであなたのキャリアを始めてください。 スペシャライゼーションの取得は無料ではありませんが、証明書が不要な場合は、これらのすべてのコースを無料で受講できます。コースの名前を見て、検索を使用してコースを見つけてください。



機械学習に興味がある人には、Bandu Researchの主任科学者Andrew Ngによるコースをお勧めします。彼は、スタンフォードの非常勤教授で、Courser: Computer Learningの創設者です。



データサイエンスとは



データサイエンスは新しい活動分野であるため、データサイエンティストの要件はまだ完全には形成されていません。 私たちの時代のダイナミズムを考えると、おそらくデータサイエンスは、大学で教えられる独立した職業になることはありませんが、実践とスキルのセットのままです。 しかし、これらはまさに、今後数年間で非常に需要のあるプラクティスとスキルです。



All Articles