ビッグデータとデータサイエンスの分野における労働市場の概要

こんにちは、こんにちは! 関連する検索クエリで約1000の空席が見つかりました。その後、見出しと説明で手動でフィルタリングし、HeadHunterでビッグデータとデータサイエンスの分野で288のアクティブな空席を使用してレビューを準備しました。



実際、他のリソース(SuperJob、Blastim、ソーシャルネットワーク、企業サイトなど)が考慮されていないため、よりアクティブな空席があります。 さらに、これは現在の状況の単なるスナップショットであり、毎日空席がいっぱいになり、新しい空席が表示されることを理解する必要があります。



データはHeadhunter APIを介して取得され、データはPythonライブラリを使用して受信および処理されました。



HeadHunterに投稿された空席の地理的分布は次のとおりでした。



画像






すべてのアクティブな空室のほぼ半分(128)はモスクワにあり、サンクトペテルブルクでは3倍以上少なく(42)、その後に隣接する州の首都であるベラルーシ(16)とウクライナ(12)が続きますが、カザフスタンやその他の大都市はそうではありませんロシアの都市。 先進国の少数の欠員は、ロシアの他の都市およびCISの欠員とともに、その他グループに分類されました(58)。



サンプルのほぼすべての空席は完全雇用を前提としていますが、十分な数の空席があるため、柔軟なスケジュールで作業できます(32)。 データベースには、リモート作業の可能性がある11の空きがあります。 さらに、空室の大部分(244、つまり約85%)は、フルタイムでオフィスにいる必要があります。



画像






画像






これは、職務経験による空室の分布です。



画像






この分野の専門家レベルの経験(6年以上)を必要とする仕事は最もまれなカテゴリーであり、そのような空席は9つしかありません。 仕事経験の最も一般的な平均値:1-3年(152)および3-6年(110)。 データベース17のような空席など、仕事の経験がない人にも機会があります。



ほとんどの空席の給与は示されていませんが、給与を示す空室の利用可能なサンプル(56)は、市場のおおよその支払いレベルを推定するのに十分であると考えました。



画像






賃金が示された空席の一部については、外貨で表されました。



画像






外貨のすべての金額は、現在のレートでルーブルに変換されました。



HeadHunterの給与は、特定の金額から特定の金額までのように示されます。 両方の値が示された場合、それらの間の平均が賃金の推定値として採用されました。 「from」のみの場合、示された値に10%が加算され、「to」のみの場合、示された値は10%減少しました。 給与は、モスクワ、先進国、およびロシアとCISの他のすべての都市の職務経験のカテゴリ別に個別に計算されました。



画像






表からわかるように(その値は1000ルーブルで示されています)、モスクワでは賃金のレベルは実務経験のすべての値に対してより高くなっています。 この違いは若い専門家にとって特に重要です:職業経験が3年未満の専門家の場合、モスクワの給与は3分の1高く、モスクワでは(職業給与が示されているものの中で)職業経験のない欠員がすべて集中しているのは正確です。 リストの先進国に空席は1つしかありませんでした。日本では、そこでの給与水準は著しく高く、モスクワの最高賃金のほぼ2倍です。 サンプルの平均給与は、実務経験なしで13万8千ルーブルでした-ほぼ2倍少なく、わずか6万3千ルーブルです。 ロシアで示されている最大給与は220ルーブルです。



HeadHunterには、ジョブの説明で重要なスキルを示すための別のフィールドがありますが、サンプルのほとんどのジョブでは入力されていません。 さらに、主要なスキルは手動で入力され、固定リストから選択されないため、同じスキルを書くことは異なる場合があります。 この点で、トップ50の主要スキルのリストは、空席データベースに基づいて作成され、その後、専門家の方法で補完されました。 多くのスキルについて、異なる言語(機械学習と機械学習、JavaScriptとJSなど)を含むいくつかの同義語が与えられました。 一部のスキルについては、CをC ++から、JavaをJavaScriptから、SQLおよびMySQLをNoSQLからなどに分離するためのストップワードのリストが提供されました。 さらに、これらのキーワードの検索は、キースキルと職務記述を組み合わせたテキストの正規表現を使用して実行され、空席ごとに1つのエントリがカウントされました。



画像






この専門分野で最も必要なスキルはPythonの知識でした:288の空席のうち170で言及されています。 Javaは、92の空席、C ++の58、Scalaの46、Matlabの44で言及されています。データ分析環境のR(21)とJulia(3)を含む他の言語はあまり人気がありませんでした。 2番目に人気のあるスキルは、SQLの知識(140の空席)です。 機械学習法の知識は、104の空席、データマイニング法-81で、ディープラーニング-52で必要です(キーワードとして、ディープラーニングに加えて、ディープラーニングで使用されるメインライブラリの名前(TensorFlowやTheanoなど)、自然な処理方法が含まれます)言語(テキストマイニングを含む)-23で。122の空席でビッグデータテクノロジーの知識が必要ですが、ここで正確に何を意味するかは完全には明確ではありません。 具体的には、Hadoopは99の空席で言及され、Sparkは84で、Hiveは39で、MapReduceは29で、Kafkaは19で、言及された21のMongoDBを含む37の空席でNoSQLデータベースの経験が必要です。 41の仕事には英語の知識が必要で、22の仕事には統計の知識が必要です。 Kaggleデータ分析コンペティションサイトは、25件の仕事で言及されています。



画像






上記の図は、HeadHunterスペシャライゼーション分類子に応じた空席の分布を示しています(1つの空席は同時に複数のスペシャライゼーションに属することができます)。 この図からわかるように、サンプルのほとんどの空席は開発(185)とデータ分析(162)に関連しています。 残りの専門分野には、プロジェクト管理(66)や数学(60)など、かなりのマージンがあります。



画像






専門分野については、空席の大部分は情報技術の分野に関連しており、一部は科学と教育の分野に関連しており、おそらく数学とアルゴリズムに起因しています。



サンプルに応じた現実に一致する雇用主の格付けを作成することはできませんでした(その企業で満たされたすべてのポジションが表示されるわけではなく、アクティブな求人のみが表示されます)。 そのため、業界ごとに空席の内訳を優先して選択しました。



HeadHunter APIでは、雇用主企業向けに業界別の分布を取得することができないため、165名の雇用主の名前と説明に基づいてサンプルを手動で選択する必要がありました。 結果として生じる産業別の空室の分布を下の図に示します。



画像






最大の産業は、情報技術に特化した企業です(93人の求人)。 これらのうち、インターネットポータル(YandexやAvitoなどのインターネット、19の空き地)、通信会社(16の空き地)、ITコンサルティング(16の空き地)、およびITセキュリティ(たとえば、Kaspersky Lab、4の空き地)を中心に形成された企業は別々に選ばれました。 。 マーケティング業界で2番目に多い求人には、メディアおよび広告代理店が含まれ、マーケティング調査を実施している企業は少数でした。 彼らは23の空室を占めています。 銀行部門には20の空席があり、残りの金融部門は18でした。ゲーム開発業界はかなり大きな雇用主でした(18の空席)。 ただし、ゲーム開発業界の場合、サンプルには異なる地域の複数の重複する位置が含まれていました。 ファッション小売を含む小売では、9つの空席がありました。 サンプルのFMCGおよび製薬会社は、実際には代表されていません。 生物学と医学のデータ分析の人気とバイオインフォマティクスの専門家の人気にもかかわらず、これらの分野のアクティブな欠員の数は比較的少ないことが判明しました(ヘルスケアで3つ、バイオテクノロジーで2つ)。



プログラム 「ビッグデータスペシャリスト」は3月に開始されることをお知らせします。



All Articles