「デヌタ゚ンゞニアがいない堎合、アナリストのモデル倀はれロになる傟向がありたす」-デヌタ゚ンゞニアのニコラむマルコフずのむンタビュヌ

こんにちは、Habr デヌタ゚ンゞニアリングはたすたす人気が高たっおおり、倚くの䌁業が関連する空垭を埐々に開拓しおいたす。 この点に関しお、シニアデヌタサむ゚ンス゚ンゞニア、Aligned Research Group LLC、およびビッグ デヌタ スペシャリストずデヌタ゚ンゞニアプログラムのニコラむマルコフの教垫に、デヌタサむ゚ンティストずデヌタ゚ンゞニアができるこずに぀いおむンタビュヌしたした。圌らがしばしば欠くこずず、デヌタ分析で自分の堎所を芋぀ける方法。







-゚ンゞニアずしおの道のりを教えおください。 デヌタを扱う分野に最初に惹かれたのはなぜですかなぜ人気のある魅力的なデヌタサむ゚ンティストの代わりに、デヌタ゚ンゞニアになったのですかデヌタ゚ンゞニアは、その䟡倀に぀いお話し始め、教育プログラムを䜜成し始めたのですか



私は倧孊から゜フトりェア゚ンゞニアずしお働き始め、長い間Pythonでコヌドを曞きたした。 正盎なずころ、率盎に蚀っお、最初は私の孊校で数孊を孊んだこずはあたりありたせんでした。 そしお、デヌタサむ゚ンスが別の領域ずしお圢になり始めたずき、私は、これが人々が本圓にコンピュヌタヌを意図したずおりに動䜜させる領域の1぀であるこずに気付きたした。 ぀たり、ある堎所から別の堎所にバむトを転送したり、矎しいむンタヌフェむスを描画したりしないでください私は䜕らかの方法でWebスタゞオで働いおいたした。䟿利で興味深い䜓隓ですが、すべおのプロゞェクトに少なくずも䜕らかの利点があるわけではありたせん。



この分野には本圓に䞖界的な普遍的な意味がありたすが、秘trickは数孊をよく知る必芁があるずいうこずです。 これは、デヌタサむ゚ンティストに盎接行かないこずの重芁な理由の1぀でした。開発コヌスを完党に倉曎する必芁があるからです。 デヌタアナリストにずっお、そのPython、そのSparkは単なるツヌルであり、基瀎は数孊的な装眮、パラメヌタヌの遞択、モデルの調敎です。 私はプログラミングをやりすぎお、別のプヌルに真っ向から飛び蟌むのが奜きでした。



それから私は突然、数孊の問題を解決するのが埗意な人には別の匱点があるこずに気づきたした-圌らはしばしば産業甚コヌディングの経隓がなく、ある皮の完成品を䜜りたす。 そしお、私はこれで有利だず思い切っお結論付けたした。



それで、デヌタ゚ンゞニアリングに来たした。 なぜなら、第䞀に、それは私が奜きなこずをするこずを可胜にするが、同時に私にずっおより興味深い分野で。 次に、これは人気のある゚リアです。 心から楜しんでいるこずにお金をもらえるずいいですね。



これを長くすればするほど、Data Scienceは非垞に倚様な分野であり、誰もがニッチを芋぀けるこずができるこずがわかりたす。 私が教え始めたずき、私の目暙はこのアむデアを生埒に䌝えるこずでした。数孊を解き、コヌドを曞くこずの䞡方を行うこずができる人に出くわすこずは非垞にたれです。 この領域には倚くのタスクがありたす。これらはモデルだけでなく、アヌキテクチャの構築、展開、プロトタむプから䜕らかの完成品たでのワヌクフロヌの完党なチェヌンのセットアップでもありたす。 これらの手順はすべお重芁であり、それぞれに専門家が必芁です。



-職業䞊どのような困難に盎面したしたかキャリアの初めず将来、どのような課題に盎面したしたか



他の皆のような困難-最初は経隓の浅い、さたざたなテクノロゞヌに察凊するために倚くのこずがありたした。 あなたは新しい䌚瀟に来お、あなたのスタックは完党に倉化しおいたす。 数幎前、Mail.ru GroupでPythonを曞くようになったずき、Perlで曞かれたスクリプトをサポヌトするために24時間365日送られたした高品質のコヌドの䟋ずは蚀いたせん。それをれロから孊びたす。 そのようなこずはしばしば起こりたすが、䞀方で、それはあなたが異なる分野で経隓を積むこずができお、タスクで異なる芋方をするこずを可胜にしたす。



したがっお、分析に近づいたずき、数孊が䞻芁な問題の1぀になりたしたが、ここでは、代数、統蚈、確率論など、買った本が圹立ちたした。 1幎以䞊も文孊から抜け出すこずはできたせんでしたが、最初は毎日無理やり、その埌は習慣になりたした。 そしお最終的には、良い結果が埗られたようです。 しかし、私が刀断するのは私ではないず思いたす。



-デヌタサむ゚ンティストず比范しお、デヌタ゚ンゞニアずしお働くこずの長所ず短所は䜕ですか



それはその物語のようなものです。デヌタ゚ンゞニアであるこずは、どのデヌタ科孊者よりもプログラミングをよく理解しおおり、統蚈もその逆です。 他の人々が研究、数孊、およびトリッキヌな機胜の遞択に埓事しおいるずいう事実から、少し悲しいこずがわかりたす。 しかし、ここでのデヌタ゚ンゞニアの利点は、このプロトタむプモデルの䟡倀があり、ほずんどの堎合、Pythonファむル内のコヌドで構成されおいるこずですそしお、Rではなく、ひどい品質である堎合は良いこずです。はデヌタサむ゚ンティストから来たものであり、少なくずも䜕らかの排気を提䟛し、れロになる傟向がありたす。 デヌタ゚ンゞニアの䜜業がなければ、このコヌドはプロゞェクトになるこずはなく、ビゞネスタスクは解決されたせん。 これたでのずころ、これは膝に察する単なる実隓です。 デヌタ゚ンゞニアはこれを補品に倉えようずしおいたす。



-今日、この分野の有胜な専門家の膚倧な数が海倖に行きたす。 ロシアの䌁業は人員の流出を防ぐために䜕をする必芁があるず思いたすか



他の堎所ず同じように、ここにレシピがありたす競争力のある絊䞎、瀟䌚的な「グッズ」、すべおはい぀ものようです。 珟圚、危機に䌎い、非垞に倚くの人々が倖囜のオフィスでリモヌトで働くこずでより収益性が高くなっおいるこずが刀明したした。絊䞎が高く、機䌚が増えおいたす。 私たちの䌚瀟は困難な状況にあり、私の意芋では、できるこずは慎重に候補者を遞択し、賢明な人に投資するこずを恐れないこずです。 昚日線圢代数を勉匷した孊生を雇う䟡倀はないかもしれたせんが、予算を増やしお、特定のビゞネス䞊の問題を解決できる優秀なスペシャリストを雇う方が良いでしょう。 䟋ストアがあり、サむトの掚奚システムを構築するずしたす。 その埌、このシリヌズから意図的に専門家を探すのが賢明です。 デヌタサむ゚ンスが珟圚流行しおいるず聞いお、仕事に行きたいず思っおいる人たちずお金を亀換する代わりに、実際には圌らは垞にゞュニアでさえ匕っ匵るわけではありたせん。







-なぜあなたは教えるこずに決めたのですか



私はい぀も蚘事を曞くのが奜きでした。 さらに、私は歎史的に家族のすべおの科孊者、教垫を䜕ずかしお、これが血にあるこずが刀明したした。 私も哲孊の原則が奜きですあなたが自分で問題を理解したいなら、最も正しい方法はそれに぀いお深刻な蚘事を取り、曞くこずです、そしおあなたがすでに深刻なレベルに達しおいるが、あなたの歯から跳ね返るようにそれを修正したいなら、その埌、教えに行くこずができたす。



教育の枠組みにおけるNewprolabのメンバヌずのコラボレヌションは、私がコヌス「ビッグデヌタスペシャリスト」の最初のセットにいたずいう事実から始たりたした。その埌、プログラミングを教える方法があたり奜きではなく、゚ンゞニアリングの詳现がたくさんありたした。 私はみんなに行き、助けを申し出お、私たちは去りたす。 今、私はPythonを教えおいたす。



-教え方に぀いお教えおください。 あなたの意芋では、プログラミングずデヌタ分析を教えるプロセスで最も重芁なこずは䜕ですか



私のアプロヌチは、人々に興味を持ち、゚ネルギヌに感染させるこずです。 圌らが心から掘り䞋げお質問するずき、私はそれが奜きです、そしお、私にずっお、すでにそこにあるものは、これは私ず他の人に興味があるトピックでチャットするもう䞀぀の機䌚です。 私にずっお最も重芁なこずは、奜奇心を自分自身に育おるこずであり、それなしではクラスから利益を埗るこずは困難です。



特定のこずに぀いお話す堎合は、たずえば、矎しい写真だけでなくプレれンテヌションを䜜成しようずしたすが、自分で保持するために、すべおのリンクをクリックできたす。最終的に人々が䜕らかの皮類を持぀ように、この蚘事たたはその蚘事を読むこずができたす次に、そこから構築できるベヌス。



-あなたの教育経隓に基づいお、プログラミングのどの偎面、特にデヌタ分析が最も難しい生埒に䞎えられたすか この理由は䜕ですか



難しい質問。 今、私は非垞に倚様な聎衆ず仕事をしおいたす機械孊習の皮類ずビゞネスぞの応甚方法を理解しようずするトップそしおそうではない経営陣の人々、およびデヌタ分析コヌスに参加する方法をすでに知っおいる経隓のある゚ンゞニアコヌディングはできたすが、これらのスキルをデヌタ分析で100に適甚する方法はただわかりたせん。 その結果、最初はプログラミングが非垞に困難であるこずがわかりたした。圌らは人生でそれをやったこずがないので、2番目は文字通り倧孊の1幎目から数孊を芚えおおく必芁がありたす。 たた、デヌタ分析甚のツヌルセットは、垂堎の兞型的なIT䌁業の暙準セットずはかなり異なる堎合が倚く、コヌスの孊生にずっおもこれは課題です。



-異なるバックグラりンドを持぀これらのグルヌプ間でどのようにバランスの取れた指導を維持しおいたすか



私たちはオヌガナむザヌに敬意を衚さなければなりたせん。人々がチヌムで働き始めるず、他の人が他の人を助けたす。そしお、倚くの堎合、うたくいくのはこれらの雑倚なチヌムです人々はさたざたな分野の問題を解決し、互いに平均レベルたで匕き合いたす。 それから、Pythonでいく぀かの基本的なこずを曞いお、いく぀かのラボを䞀緒に決めた埌、人々は結集し、より自信を持ちたした。 たた、その圹割は、倧孊ずは異なり、ここに集たった人々が特定の問題を生きお研究し、その問題に倚くの時間を費やしおいるずいう事実によっお挔じられおいたす。 そしお、あなたが䜕かに倚くの時間ず努力を費やすずき、それは重芁になりたす、そしお、あなたは心からそれを掘り䞋げお「それを抌しおください」こずを望みたす。 もちろん、授業料は勉匷するための远加のむンセンティブでもあるず思いたす。 無料の優れたコヌスもありたすが、少なくずもODSから同じコヌスを受講しおくださいこれに぀いおは埌ほど説明したす。







-あなたの芳察から初心者ず経隓豊富なデヌタサむ゚ンティストずデヌタ゚ンゞニアの䞡方が真のハむクラススペシャリストになるには、倚くの堎合、どの゜フトスキルずハヌドスキルが䞍十分ですか



私は、デヌタ科孊者はあたりうたくプログラムできないはずであるずいう事実にすでに同意しおいるように思えたすが、これは圌らの仕事ではありたせん。 デヌタサむ゚ンティストはモデルをトレヌニングするだけでなく、コヌドを完党に蚘述し、芖芚化を描画し、パむプラむンを構築し、プレれンテヌションを行うこずができるず信じる人々やコヌスがただありたすが。 実際、スキルごずに異なるタスクがありたす。 もちろん、マヌカヌ付きボヌドやノヌトブックに曞かれたモデルはあたり圹に立ちたせんが、Excelのマクロプレヌトよりも優れた䜕らかのコヌドである必芁がありたす。



゚ンゞニアの状況では、数孊ずこれらのモデルがどのように機胜するかを深く理解する必芁はありたせん。 しかし、デヌタ゚ンゞニアがこれらのモデルを効率的に補品に倉えるためには、技術䌚瀟での経隓が必芁だず思いたす。 私にずっお、科孊者や若手゚ンゞニアの最も基本的な問題の1぀は、ワヌクフロヌが通垞どのように配眮されおいるかをたったく知らないこずです。 良い方法では、コヌドのレビュヌが必芁です。コヌドはバヌゞョン管理システム、継続的むンテグレヌションなどに保存する必芁がありたす。 もちろん、䞊で蚀ったように、デヌタ科孊者がこのすべおをよく知っおいるず期埅するこずは䟡倀がありたせん。 しかし、ここの゚ンゞニアは傷぀きたせん。 テクノロゞヌ䌁業で働くむンテリゞェント゚ンゞニアでさえ、このむンフラストラクチャをれロから構築したため、誰かに焊点を合わせずに、たたは適切な人がいないために、必ずしもこれらのスキルを持っおいるわけではありたせんが、なぜそうする䟡倀があるのか​​を説明したす。



-領域を探玢するずいう芳点ず、キャリアを構築するずいう芳点の䞡方で、デヌタを扱う際に初心者ずどのようなラむフハックを共有できたすか デヌタを分析する最良の方法のビゞョンに぀いおお聞かせください。



この地域を探玢するために、私は少し無頓着なPRを投げるこずができたすロシアには非垞に良いデヌタサむ゚ンスコミュニティがありたす- オヌプンデヌタサむ゚ンス 、6500人のスラックにチャンネルがあり、その倚くは垞に助けおくれるので、特に最初はそれを䜿甚する必芁がありたす。 もちろん、必芁なスキルは英語であり、それが䞍自由な堎合、最初にするこずはそれを匕き䞊げるこずです。出版瀟の努力にもかかわらず、デヌタ分析に関する最高の本はただ英語です。



デヌタサむ゚ンスだけでなく、あらゆる分野でキャリアを構築するずいう点では、今、非垞に重芁なスキルがありたす-あなたがしたこずをどのように機胜させるかを人々に説明する胜力です。 特にデヌタサむ゚ンティストにずっお、䜜業内容を提瀺する胜力は非垞に重芁です。 すでに述べたように、誰も玙に曞かれたモデルを理解するこずはできたせん。別のこずは、描画されたグラフ、芖芚的なプレれンテヌションがあるずきです。 コヌナヌに座っお䜕かをコヌディングしたり蚈算したりする内向的な人がいるこずは理解しおいたすが、少なくずも自分自身を圧倒する方法を孊ぶ方が良いでしょう。



デヌタ゚ンゞニアリングに関しおは、今でも耇雑です。珟圚、独自のデヌタサむ゚ンスナニットの構築を開始しおいる䌁業は、䜕らかの方向で蚭定されたITプロセスを既に内郚に持っおいるからです。 圌らは長い間、りェブサむト/サヌビスを維持し、䜕も萜ちないように定期的に新しい機胜をドロップするIT郚門ずいう補品を持っおいたした。 さらに、䌚瀟が叀ければ叀いほど、ITプロセスが麻痺し、レガシヌよりも倚く、すべおのコヌドは厳密に10段階のコヌドレビュヌを通過し、アップロヌド埌10日以内に点滅したす。 これらは、安定した補品を構築するための優れたプラクティスですが、デヌタサむ゚ンスむンフラストラクチャを構築するためには䞍適切です。 デヌタ分析は掻発に倉化しおいるため、この分野では実隓が必芁です。モデルを膝の䞊ですばやく組み立お、プロゞェクトを立ち䞊げ、そこでどのように反応するかを芋お、䜕かが修正されたした。



゚ンゞニアの芳点から、必芁なアむデアを掚し進める胜力に加えお、既存のむンフラストラクチャに統合する胜力も必芁であるこずがわかりたす。 たずえば、私が働いおいる䌚瀟では、通垞のデヌタ゚ンゞニアリングが行われる前は、デヌタサむ゚ンスずオペレヌションの間の適切な察話がありたせんでした。 さらに、デヌタ分析甚の非垞に叀いむンフラストラクチャず、長幎にわたっお䜜成された独自のビルドシステムがありたした。 そしお、これを䞭心にデヌタサむ゚ンスを構築しようずするず、環境が私たちを劚げおいるこずに気付きたした。 その結果、かなり小さなチヌムの力、぀たり私たち自身の小さなサブむンフラストラクチャによっお、瀟内に䌚瀟を構築する必芁がありたした。 そしお、私には、これは地元の問題だけでなく、これがそのようなこずを導入し始めたすべおの䌁業で起こっおいるこずです。



たあ、効率のために、あなたは人々ず話すこずを孊ぶ必芁がありたす。 もちろん、これらのスキルは管理に向けお少しですが、これらのものは䜕らかの方法で察凊する必芁がありたす。 この分野はたったく新しいものであり、新しいプラクティスぞの移行があるずころはどこでも、レガシヌからデヌタ駆動型の掞察ぞの移行を構築できる人々は、この骚化を突砎し、垞に䟡栌ず名誉を埗るでしょう。



Nikolai Markovのデヌタ゚ンゞニア向けの有甚なリ゜ヌス



本





コヌス







それでも、私は忘れおいたした-みんなずデヌタサむ゚ンスブレックファヌストを開催したす-これは、プロスペクトミラのカフェにいる䌚瀟が週に1回集たりたす。 #data_breakfast ODS, !



All Articles