Retail Rocketチームは、コンピューティングクラスターに高度に専門化されたHadoop + Sparkテクノロジースタックを使用しています。これについては、Habréのエンジニアリングブログの最初の投稿ですでに説明しました。
そのような技術の専門家を見つけることは、特にScalaのみでプログラムしていると考える場合、見つけるのが非常に困難です。 したがって、私は既製の専門家ではなく、仕事の経験は最小限ですが、大きな可能性を秘めている人を見つけようとします。 候補者が最後のコースの学生である場合は、パートタイムの人を連れて勉強と仕事を組み合わせるのも便利にします。
Retail Rocketで研修生はどのように選択されますか?
私はいつも初めてSkypeや電話に電話して、あなたが私たちを見つけた方法から始めて簡単な質問をします(私たちの空室はしばしばGoogle検索で見つけられます)、機械学習に関する基本的な質問で終わります。
インタビューを受けるには、Courseraから機械学習コースを受講することを強くお勧めします。 このコースは非常に基本的であり、数式を覚えたり、Pythonで既製のライブラリを使用するのではなく、理解することを教えます。 これは私たちにとって非常に重要です。多くの場合、手作業でアルゴリズムを記述する必要があります。
回答が私に合っている場合は、直接面接に招待します。面接では、候補者をより詳しく知ることができます。 結論として、通常は自宅で、RecSysカンファレンスの科学論文を研究し、アルゴリズムを「エンコード」し、テストデータセットを実行するタスクを与えます。
人が選ばれた後はどうなりますか?
オンラインコースを使用して、新しいアナリストのスキルを向上させ、最小限の労力で新しい従業員をトレーニングしています。 私たちに移る前に、 ビッグデータ大学からテスト付きの一連の非常に短いコースを受講することをお勧めします。
- Hadoop -4時間。 Hadoopコンポーネントの簡単なコース。
- スパーク 1-3時間。 Spark、RDD、Api in Java、Python、Scala、簡単なアプリケーションの作成、Spark SQL、MLLib、Spark Streaming、Graph Xについて
- スパーク2-4時間。 Sparkでのアプリケーション作成の上級コース。
次に、仕事の初日から、アナリストは次のコースのタスクを正常に調査および実行する必要があります。
- Scalaプログラミング言語コース 、非常に簡単で理解しやすい。 Scalaの候補者の中で、誰もほとんど知らないので、このコースは非常に迅速にプロセスに入るのに役立ちます。
- 推奨システムのコース 。 レコメンダーシステム-これは、かなり狭いトピックである機械学習のブランチの1つです。 私たちと協力するには、このトピックを完璧にマスターする必要があります。 候補者は、推奨システムの構築に関する知識と経験を持つ必要はありません。 このコースは、人を作品の主要部分に引き込むための大きな助けになります。
これら2つのコースを正常に完了することは、試用期間を正常に完了するための必要条件として雇用契約に規定されています。 原則として、これらのコースを学習してタスクを完了するには3か月で十分です。
私がお勧めするトライアル期間を過ぎた後のオプションですが非常に重要なコース- リアクティブプログラミングの原則 、Scalaの例を使用した関数型プログラミング言語でのプログラミングへの非自明なアプローチを説明します:Monads、Futures、Actorsなど このコースのタスクは非常に複雑ですが、非常に興味深いものです。
このシステムは、過去1年半にわたってRetail Rocketに実装され、非常に優れていることが証明されています。
PS ScalaとSparkに関する完全に新鮮で包括的なコース をお勧めします。
PPS私たちは常に新しいチームメンバーを歓迎しており、すぐに「 .NET Developer 」の役職にいくつかの空席を開設しました。 技術的なスタックとタスクのレベルは、Habréの最初の投稿で推定できます。 履歴書はavchizh@retailrocket.ruに送信できます(HRはありません。すぐに直接連絡します)。