Technosphere Mail.Ru孊生プロゞェクト、実隓宀、デヌタサむ゚ンスチャンピオンシップ

2014幎以降、モスクワ州立倧孊。 MV Lomonosovには、Mail.Ru Groupからのデヌタマむニングず情報怜玢の分野での教育プログラムがありたす。 圌女の孊生はこの分野でさたざたな分野を研究し、䌚瀟の関連郚門、および2014幎秋に開蚭したモスクワ州立倧孊の研究宀でむンタヌンシップを行っおいたす。 テクノスフィアに぀いおは、 ここずここですでに説明したしたが、この蚘事では、トレヌニングプログラム、その結果、倧孊内の研究宀の掻動、およびプログラムのむンタヌンからの短いむンタビュヌに぀いお詳しく説明したす。







テクノスフィアプログラム



珟圚、このプログラムは4孊期ず10の孊科で構成されおおり、そのうちのいく぀かは毎幎行われおいたす2孊期が進行䞭です。 各分野では、緎習が重芖され、孊生はプロゞェクトを個別にたたはグルヌプで実斜したす。 圓初、テクノスフィアプログラムは毎幎行われおいたしたが、すぐにこの時間では䞍十分であるこずに気付き、2幎に延長するこずを決定し、䞀郚の分野の研究期間を延長したした。 「デヌタ分析入門」ずいう1぀の分野のみを远加したした。これにより、数孊ず統蚈の分野からいく぀かの必芁な偎面ず、䜿甚するツヌルプログラミング蚀語、ラむブラリなどの䞻芁トピックが明らかになりたした。 このコヌスの講矩は、 YouTubeチャンネルでご芧いただけたす 。 私たちが拡倧した他の分野。 特に、C ++の詳现な研究の䞀郚がC ++のマルチスレッドプログラミングに远加され、情報怜玢のブロックが重芁になりたした。



たた、䞭栞でない孊郚から来た人を助けるために、準備コヌス「アルゎリズムずデヌタ構造」を远加したした。 このコヌスでは、さたざたな基本アルゎリズムを分析し、特定のタスクのデヌタ構造を合理的に遞択する方法を孊びたす。 これらの講矩は、察応するYouTube プレむリストでも利甚できたす。



開発䞭の教育プロゞェクトいく぀かの興味深い䟋



デヌタ分析の玹介。 孊期䞭、孊生はオヌプンデヌタに基づいお再珟可胜な研究を完了する必芁がありたす。 䜜業は4〜6人のグルヌプで行われ、各チヌムには独自のテヌマがありたす。 この調査はProject Jupyterで実斜され、Python、R、Javaの蚀語を䜿甚できたす。 研究の段階を定矩するCRISP-DMず同様の方法論に基づいおいる必芁がありたす。



初期デヌタセットずしお、子にはいく぀かのオプションが提䟛されたす米囜政府からのオヌプンデヌタ、米囜瀟䌚サヌビスからのデヌタ、囜連デヌタ、欧州連合オヌプンデヌタポヌタル。たた、別のデヌタセットを自分で芋぀けるこずもできたす。



倧量のデヌタを知的凊理するためのアルゎリズム。 ゜ヌシャルネットワヌクTwitterのナヌザヌを分類するタスクは解決䞭です。 孊生には入力ずしおナヌザヌIDのリストが䞎えられ、䞀郚のナヌザヌにはナヌザヌが属するカテゎリヌが䞎えられたす。 カテゎリの䟋ずしおは、コンピュヌタヌゲヌムぞの情熱䞭毒/関䞎なしがありたす。 プロゞェクトの目暙は、䞎えられおいないナヌザヌのカテゎリを最も正確に予枬するアルゎリズムを䜜成するこずです。 コヌス䞭、孊生はオヌプンWebサヌビスAPIを䜿甚しお独自にデヌタを収集し、機胜の構築ず遞択のためのさたざたなアルゎリズムず機械孊習アルゎリズムを実装および適甚したす。



倧量のデヌタを凊理する方法。 最終孊期のプロゞェクトは、现胞内の倉異の存圚を刀定するこずに専念しおいたす。 このために、 p53 Mutantsデヌタセットが䜿甚されたした。その特城は、ラベルのシフト分垃です陜性サンプルの1未満。 䜜業は任意のプログラミング蚀語で実行できたすが、ほずんどの堎合、人はPythonずC ++を䜿甚したす。



子䟛の2幎のトレヌニングは孊期を完了し、チヌムでの卒業プロゞェクトの開発に専念したす。 来幎の春、第4孊期の前に生埒たちが勉匷を終えるずきに私たちはあなたに教えたす。







孊生はどこでむンタヌンしたすか



テクノスフィア内で孊生が受ける知識ずスキルは、広告テクノロゞヌ広告のタヌゲティング、ニュヌスの分類、Mail.Ru Search、アンチスパムなど、さたざたな郚門に適甚できたす。 珟圚、テクノスフィアの23人の卒業生のうち、12人がプロゞェクトTarantool、My World、Mailなどの研修生です。 印象を共有するように䟝頌したした。



スノィアトスラフ・フェルドシェロフ



-あなたはどのナニットで働いおいたすか



-私はタランツヌル郚門で玄3か月働いおいたす。 チヌムが䜕をしおいるのかを倚かれ少なかれ想像しおいたので、私はそれを遞びたした。そしお、私は内郚の雰囲気が奜きでした。 さらに、リヌダヌのコンスタンチン・オシポフは、テクノスフィアの孊期コヌスを教えたした。それは圌自身のやり方では難しく、刺激的でした。



-どのようなタスクを解決したすか



-私は、倧芏暡で倧容量のタスク、぀たりTarantoolでのSQLサポヌトの実装に取り​​組んでいたす。 私に加えお、圌女はテクノスフィアの別の卒業生に埓事しおいたす。 実際、珟圚Tarantoolずの通信はLua蚀語で行われおおり、SQLを䜿甚する可胜性を実装しおいたす。 䞻なアむデアは、より倚くのナヌザヌがシステムで䜜業できるこずです。 䞻にCおよびC ++で蚘述したす。



-䜜業結果はどこに適甚されたすか



-ただ適甚されたせん。 プロトタむプを䜜成しおから、リファクタリング段階ず、経隓豊富な参加者による結果の倧芏暡な凊理を行いたす。 䞀般的に、私たちにはただ長い道のりがありたす。



-開発蚈画はどのようなものですかどのナニットで働きたいですか



「私は今やっおいるこずが奜きです。」 すべおがうたくいき、これが私のものだず理解できたら、この分野を掘り䞋げたいず思いたす。 しかし、時には蚘事を読んで仲間ず話をし、本圓にすべおをgiveめ、デヌタ分析に携わり続けたいず思うこずがありたすこれはテクノスフィアの䞻な研究分野でした。 しかし、それがどうなるかはただ完党には䞍明です。 時間はわかりたす。



ミハむル・ガルコフ



-どのナニットで印象ずしお働いおいたすか



-私は掚薊システムの郚門で働いおいたすが、怜玢で働くこずを期埅しおいたした。 掚薊システムに぀いおはほずんど知らなかったので、テクノスフィアの講矩でしか䌚ったこずがなかったので、初めお知識に远い぀き、そのトピックに関する倚くの科孊蚘事を読む必芁がありたしたが、十分な動機付けがありたした。 講矩で話されたこずから、ほずんどすべおが䜕らかの方法で確認されたした。 ビッグデヌタは本圓に倧きいです。 凊理のためのアルゎリズムずツヌルを理解するこずは倧いに圹立ち、デヌタ/アルゎリズムを操䜜するための時間の配分はほが正しいこずが刀明したした。私にずっおは、玄70〜30です。



-むンタヌンシップの最初にどのような課題を解決したしたか



-最初は、さたざたなアルゎリズムで蚘事を分析し、その機胜を調査し、さたざたなメトリックを䜿甚しおそれらを比范したした。



-珟圚、どのようなタスクを解決しおいたすか



-䞻に、私たちのナニバヌサルレコメンダヌシステムのアルゎリズムを構築し、デヌタを準備しおいたす。



-䜜業結果はどこに適甚されたすか



-クラスメヌトずメむン怜玢で。



-開発蚈画はどのようなものですかどのナニットで働きたいですか



-今のずころ、私は匕き続き掚奚事項に察凊したいのですが、取埗した知識を怜玢自䜓に適甚するこずは興味深いでしょう。



-メンタヌの印象は



-ドミトリヌ・゜ロノィ゚フが私の指導者であったこずは非垞に幞運でした。 目暙ずその成果を蚭定する際に圹立぀コメントず支揎に加えお、新しいアむデアの亀換ず新しいこずに挑戊する意欲を特に感謝しおいたす。



孊生のためのテクノスフィア研究宀







テクノスフィアの立ち䞊げからわずか6か月埌の2014幎の秋に、プロゞェクトの孊生が䌚瀟の郚眲の実際のタスクに取り組むこずができる独自の研究所を開蚭するこずにしたした。 タスクの委任に最も関心のある孊生は、オヌディ゚ンスセグメンテヌションに埓事する広告テクノロゞヌ郚門の郚門の1぀であるこずが刀明したした。 このナニットの責任者であるアヌサヌ・カドゥリンにいく぀か質問をしたした。 以䞋のむンタビュヌをご芧ください。



-研究宀を蚭蚈するずきに、チヌムの前にどのようなタスクが蚭定されおいたしたか



-圓初、私たちは子䟛たちにさたざたなタスクを䞎えるこずを蚈画したした-研究ず応甚の䞡方。 しかし、ビゞネスずしおの私たちにずっお、孊生が䌚瀟の壁の倖でタスクの䞀郚をリモヌトで実行できるずすぐに信じるこずは困難でした。なぜなら、タスクが完了しただけでなく、 タむムリヌに完了したこずが重芁だからです。 同時に、孊生ず䞀緒に仕事をしたかったので、孊郚が解決したすべおのタスクの䞭で、リモヌトワヌクに最も適したものを遞択したした-広告セクションのカタログ内のカテゎリを曎新したした。 システムのナヌザヌ広告䞻は広告予算をより効率的に䜿甚できるように適切なタヌゲットオヌディ゚ンスを遞択するこずに関心がありたすず、広告システムを実行しおいるサむトぞの蚪問者の䞡方にずっお重芁です。



-そしお、誰が研究宀で働いおいたすか



-実隓宀の䜜成時に、2人の埓業員がすでに私たちのナニットで働いおいたした-MSTU imからTechnoparkを卒業したした。 したがっお、バりマンは最初、実隓宀を蚭蚈するずきに、すべおの教育プログラムから玄10人の実隓宀アシスタントを募集する蚈画がありたした。 しかし、提案されたタスクは非垞に具䜓的であり、準備が必芁なため、テクノスフィアのみから人材を募集するこずにしたした。



ある時点で、玄8人が研究宀で働いおいたす。 残念ながら、现流がありたす。 このプログラムは毎幎行われ、テクノスフィアを卒業した埌、圌らは䌚瀟の郚眲に移りたした。 このプログラムは2幎間続いおいるため、状況は改善されたした。



-ラボはどのようなタスクを解決したすか



-珟圚、基本的に異なる皮類のタスクがいく぀かありたす。 䜜業の必須郚分は、実際には、アクセサリヌのマヌクアップです。 ナヌザヌがテヌマのサむトやペヌゞを収集し、正芏衚珟を蚘述したり、キヌワヌドを遞択したりするこずで、ナヌザヌの興味をより正確に理解したり、興味が倉わったりしたす。 さらに、圌ら自身が同僚の䜜業の品質を評䟡し、匿名化されたデヌタでシステムがペヌゞを正しくレむアりトしおいるかどうかをチェックし、゚ラヌを修正したす。 おそらく、この䜜業には最も時間がかかりたす。



ただし、マヌクアッププロセスの倧郚分は䜕らかの方法で自動化されおおり、スタッフはこの自動化の倧郚分を行っおいたす。 サむトツリヌを凊理するためのスクリプトを蚘述し、キヌワヌドを収集し、正芏衚珟を蚘述するためのデヌタを準備し、正芏衚珟のコンパむルを自動化したす。



明らかに、私たちは膚倧な数のドメむンずさらに膚倧な数のペヌゞで䜜業しおいるため、収集されたデヌタは倚くの堎合、Hadoopツヌルを䜿甚しお保存および凊理する必芁があり、その埌、ナヌザヌはMapReduceタスクを自分で䜜成しおトレヌニングクラスタヌで実行したす。



䜜業の䞀郚、぀たり専門家の評䟡を自動化できない堎合がありたす。 そしお、私たちにずっお実隓助手の仕事の䞻な䟡倀は、この非垞に「人間的な」怜査です。 最初は、トピックのカタログを幎に䞀床完党に曎新する時間があればいいず思っおいたしたが、今では、実隓宀のアシスタントが提䟛する自動化のおかげで、4-6か月に収たり、おそらく加速するでしょう。



テヌマカタログに盎接関連するタスクに加えお、昚幎末から研究宀で研究を行うこずにしたした。 いずれにせよビゞネスから来おいるので、おそらくこれらは完党な意味での科孊的な仕事ではありたせんが、それでもこれらは研究であり、KPIは䌚議で蚘事ずスピヌチを持っおいたす。 このために、研究宀の「プロダクション」郚門から2人の男ず、私たちのキュレヌタヌである私の埓業員であるLarisa Markeevaを遞びたした。 これたでのずころ、重芁な結果を自慢するこずはできたせんが、圌らがすでにやったこずは勇気づけられるず蚀えたす。



- 実隓宀の構造は䜕ですか



-私に加えお、圌らはモスクワ州立倧孊のセルゲむ・ストプニコフの同僚によっお監督されおいたす。 セルゲむは、2008幎からVMKの教員に勀務しおおり、ロシア科孊アカデミヌの情報問題研究所の䞊玚研究員でもありたす。 テクノスフィアの研究宀では、圌は毎週連䞭の仕事を監督し、䌚瀟から倧孊ぞのタスクの委任を保蚌しおいたす。



研究所の内郚タスクに぀いお、孊芞員のセルゲむ・ストプニコフに尋ねたした 。



-科孊的な問題ではなく、ビゞネス䞊の問題の定匏化ず解決に違いはありたすか



-ビゞネスでは、倚くの堎合、文献で適切な゜リュヌションを芋぀けお、それを䌚瀟のニヌズに適合させるだけで十分です。 もちろん、同時に、効率を向䞊させるために、実装を工業レベルに匕き䞊げる必芁がありたす。 科孊的課題の堎合、新しいアむデアの出珟ずそのプロトタむピングが特城的です。



-実隓宀甚に最初に蚭定されたタスクに぀いお教えおください。



-研究宀はテクノスフィアの䞀郚門であり、プロゞェクトの孊生を結び付け、玔粋に実甚的な問題ずタスクの䞡方を科孊的芁玠で解決し、その報酬を受け取るこずを可胜にしたす。 私の責任には、むンタヌンシップの調敎、デヌタ分析郚門ず研究教育郚門ぞの報告が含たれたす。 科孊的な郚分には、いく぀かの興味深いタスクがありたす。 そのうちのいく぀かは、Giraphフレヌムワヌクに接続されおいたす。Giraphフレヌムワヌクは、反埩グラフ分析の蚈算モデルを実装しおいたす。 さたざたな興味深いアルゎリズムを実装できたす。 珟圚、深局孊習の偎面に重点が眮かれおいたす。 この方法には倚くの芋蟌みがあり、䌚瀟の埓業員もこれに関䞎しおいたす。



-研究宀での䜜業は、孊生の研究掻動にどのように圹立ちたすか



-もちろん、最近、私たちは適甚されたタスクにもっず埓事しおいたす。 しかし、仕事は、経営陣やチヌムずしおのコミュニケヌションの経隓など、さたざたなスキルを身に付けるのに圹立ちたす。 将来的には、圌らの仕事の科孊的な結果がもたらされるこずを願っおいたす。



研究宀での䜜業のいく぀かのコンポヌネントを匷調できたす。 最も重芁なこずは、新しいアむデアを生成する胜力ず欲求です。これは、適甚された甚語でも科孊的な甚語でも、最初は小さいかもしれたせん。 実践的なスキルも匷調するこずができたす。





-い぀行うのが良いですか



-研究宀では、時間、自己芏埋を投資する必芁がありたす。 実隓宀での䜜業では、さたざたな分野にスプレヌするこずはできたせん孊生が専門分野だけでなく生蚈を立おおいるこずが倚い堎合が、デヌタ分析ずいう1぀のこずに集䞭できたす。 テクノスフィアで勉匷する孊生には、倧孊での基瀎研究、テクノスフィアでの研究の課題があり、これら2぀の分野ですべおを行う堎合は、研究宀でさらに仕事をするこずをお勧めしたす。



-生埒たちに䜕を望みたすか



-私は圌らが圌らの人生に埓事する掻動の興味深い分野を遞択するこずを望みたす。 倧孊が勉匷する胜力に加えお、あなたの知識ずスキルの興味深い応甚を芋぀けるこずができるさたざたなビゞネス分野に粟通する機䌚を提䟛するために。 MSUの孊生にこのような機䌚が䞎えられおうれしいです。



実隓宀むンタヌンのアントンゎむずミラスアミヌルも、実隓宀で働いおいる印象を共有したした。



アントン・ゎむ



-むンタヌンシップに䜕を期埅し、どのような印象を持ちたしたか



-お互いに近くで勉匷し、自宅で仕事をしおいるのは玠晎らしいこずです。 䜜業䞭に、倚くの方法を芋぀けたした。 さらに倚くの䞖界的な課題がありたした。 メンタヌは2人いたす。 論争の倚い問題の解決に圹立ちたす。それは玠晎らしいこずです。



-あなたの仕事の結果はどこに適甚されたすか



-タヌゲット広告。 ナヌザヌの過去の行動に基づいお広告を衚瀺したす。 カタログに含たれおいるサむトを蚪問した人は、これを理解し、他に興味があるかもしれないものを衚瀺したす。



-仕事䞭に面癜い話はありたしたか



-さたざたなトピックに出䌚いたしたが、そのうちのいく぀かはおもしろかったです。 仕事のおかげで、今ではあらゆる皮類のアルコヌル飲料を理解し、クレゞットシステムに぀いおすべおを知っおいたす。 時々、面癜いサむト名もありたす。



-科孊掻動における仕事はどのように圹立ちたすか



-今、私は神経生理孊のプロゞェクトに取り組んでいたす-画像によっお盞互接続されおいる脳の領域の決定。 倧量のデヌタがあり、それらを正しく凊理する必芁がありたす。 この䜜業では、テクノスフィアず研究宀で埗た知識を䜿甚したす。



-䜕をしたいですか



-機械孊習、デヌタ分析。 次の孊幎床から、適切な仕事がある䌚瀟のある郚門のオフィスに移動する予定です。



ミラス・アミヌル



-実隓宀で働くこずの印象はどうですか



-最近、1か月も経たないうちに研究宀で働いおいたす。 2週間で、いく぀かの新しいこずを孊び、仲間ず話をし、結果ずしお倧きく成長したした。 メンタヌは私たちに実際的なタスクを蚭定したすが、これは倧孊でのタスクずは倧きく異なりたす。 すぐに問題を別様に芋お、専門的に開発したす。



-科孊掻動における仕事はどのように圹立ちたすか



-実隓宀での掻動は、MMP郚門のカリキュラムの分野ず密接に関連しおいるため、それらを組み合わせるこずは、パフォヌマンスず自己啓発にプラスの効果をもたらすず思いたす。ビゞネスに察しおより責任あるアプロヌチを取り、質の高い方法で時間を配分するのに圹立ちたす。



-あなたの開発はどうですか



-最近、デヌタ分析の欠員が目を匕きたした。ここで経隓を積むず、䌚瀟でのより深刻な職に応募するず思いたす。



-ただ勉匷しおいお、ただ働いおいない人たちに䜕を望みたすか



「仕事を早く始められるような方法で時間を敎理しおほしい。」 チヌムで働くスキルが発達するため、経隓が蓄積されたす。







1幎間の実隓宀䜜業の埌、デヌタ分析の分野で基本的なトレヌニングを受けおいない請負業者や埓業員ず比范した男たちのパフォヌマンスをたずめお蚈算したした。 みんなが玠晎らしい仕事をしたこずがわかった。 圌らは、モスクワ州立倧孊の研究宀指導者であるセルゲむ・スタプニコフが蚭定したタスクを実行するだけでなく、これらのタスク甚に自動化ツヌルを独自に開発および提䟛したした。 それらのいく぀かは、䌚瀟のビゞネスプロセスでわずかに補足され、実装されたした。



2015幎の秋、研究宀内で2番目の方向である研究が開始されたした。 これらの問題は、瀟内での時間も䞎えられたす。 特に、ビゞネスタスクでニュヌラルネットワヌクを䜿甚する可胜性を積極的に調査しおいたすが、残念ながら、「戊い」でそれらをテストする準備がただできおいたせん仕事を確保するには膚倧なリ゜ヌスが必芁であり、新しい方法の䜿甚はただ明らかではありたせん。



それにもかかわらず、䜜業は進行䞭であり、むンタヌンを研究所から圌らの゜リュヌションに接続したした。 珟圚、実隓宀の6人のむンタヌンのうち2人が科孊研究に埓事しおいたす。



圌らはMCLアルゎリズムを担圓しおいたした。 グラフでクラスタリングを行うこずを目指しおいたす。



2016幎3月、ラリサマルキヌバが監督になりたした。 アヌサヌ・カドゥリンず䞀緒に、圌らは科孊者たちに科孊的な課題を課したした。



研修生は、RBMアルゎリズム制限付きボルツマンマシンの基本的な解釈を理解し、Giraphフレヌムワヌクで実装する必芁がありたした。 したがっお、圌らは、Pregelアヌキテクチャに基づいたグラフ䞊の分散コンピュヌティングシステムを構築する必芁がありたす。



この手法により、ニュヌラルネットワヌクを事前にトレヌニングできたす。 たた、クラスタヌで孊習できるニュヌラルネットワヌクは、たずえば、広告のCTRを最適化するために将来䜿甚できたす。



すでに述べたように、今のずころ、実隓ではニュヌラルネットワヌクを䜿甚したす。 おそらく、この皌働時間はオヌプン゜ヌスで蚈画されるでしょう。



むンタヌンシップの科孊的方向性の䞀郚ずしお、さたざたなテクノロゞヌJava、Hadoopを䜿甚するこずが提案されおいたす。 芖芚化ずプロトタむピングには、Python、ノヌトブックが䜿甚されたす。 Apache Sparkの䜿甚も蚈画しおいたす。 朜圚的に、研修生が研究開発するアルゎリズムは、孊士たたは修士の仕事の基瀎ずなりたす。



むンタヌンの1人であるPavel Kovalenkoに、研究宀の科孊ナニットでの仕事に぀いお尋ねたした。



-研究宀の印象はどうですか



-昚幎2月に研究宀で働くよう招埅されたした。 私にずっお、これはこのチヌムワヌクの最初の経隓です。 研究宀の圢匏は、研究ず組み合わせるのに非垞に適しおいたす。自宅で仕事をし、さらに週に䞀床倧孊でミヌティングを行いたす。



-最初にどのようなタスクを解決したしたか



-最初は、審査員のような仕事をしおいたした。 正芏衚珟では、倧芏暡なサむトのペヌゞをコンテンツの䞻題車、䞍動産、衣服などでマヌクする必芁がありたした。 トレヌニングサンプルのセットは、トピックごずのペヌゞの自動分類の問題を解決するための最初のステップです。トピックのペヌゞでは、ラボの耇数の孊生が珟圚䜜業しおいたす。



-珟圚、どのようなタスクを解決しおいたすか



-今幎の初めに、私ず同僚のアレクサンダヌ・シェチェルバコフは、Apache Giraphグラフの分散凊理のためのHadoopのアドオンの操䜜、぀たり、限定されたボルツマンマシンの分散バヌゞョンの䜜成ずいう新しい興味深いタスクを提䟛されたした。 圌らは、Mail.Ru Groupの誰かがBoltzmannマシンを本圓に倧きなデヌタに適甚する必芁があるず蚀っおいたす。



-Technosphereは、科孊掻動、研究においおどのように圹立ちたすか



-私にずっお、テクノスフィアは䞍可欠な経隓になりたした。 倚分私は少し早くそこに行きたした-2幎目の初めに。 倚くの瞬間は私には理解できたせんでした。 特に、デヌタマむニングコヌスでは確率論に関する十分な知識が必芁ですが、圓時はたったくありたせんでした。 テクノスフィアは、VMKでの孊郚の遞択に圱響を䞎えたした-デヌタマむニングコヌスず機械孊習自䜓のアむデアが本圓に奜きだったので、実際には機械孊習に埓事しおいる数孊的予枬孊科に行きたした。 実隓宀での䜜業には、Hadoop Technosphereコヌスが非垞に圹立ちたす。 実際のクラスタヌで䜜業するための実甚的なスキルは他にどこで埗られたすか



実隓宀で行う䜜業は、孊郚での研究ず密接に関連しおいるため、䞀方が他方に干枉するのではなく、補完するこずがありたした。 講矩で埗られた知識を実際に䜿甚するず、アルゎリズムの動䜜原理をよりよく理解できたす。



-開発蚈画は䜕ですか



-私はただずおも楜しみにしたくありたせん。 私は、倧孊ではほずんどの堎合、研究ず科孊研究に専念すべきだず考えおいたす。 したがっお、研究宀圢匏は非垞に䟿利です。勉匷するこずなく、郜合の良い時間に仕事をするこずができ、遠くたで旅する必芁はありたせん。



-メンタヌの印象は



-新しいタスクにより、新しいメンタヌ、Larisa Markeevaがいたす。 圌女はこの分野HadoopずGiraphに非垞に粟通しおおり、垞にコミュニケヌションに察しおオヌプンであり、困難を解決し、実装に関するアドバむスを提䟛するため、圌女ず仕事をするこずは非垞に楜しいです。 この点で、面癜い話が最近起こりたした。 䜜業には、HiveSQLに䌌たコマンドを䜿甚した分散デヌタ凊理甚のHadoopのアドオンが必芁でした。 Hiveはトレヌニングクラスタにむンストヌルされたしたが、構成が正しくないため、たったく機胜したせんでした。 ラリサは、クラスタヌの管理を担圓しおいた䌚瀟の誰かに手玙を曞き、すぐにそれを理解するこずを玄束したした。 翌日、圌はMail.Ru Groupを終了したした。 これが私たちが圌にもたらしたものではないこずを願っおいたす。 :)



デヌタサむ゚ンスチャンピオンシップMail.Ruグルヌプ



Mail.Ru Groupは、倧量のデヌタの分野でのトレヌニングに加えお、子䟛たちが手を詊すこずができる2぀の倧芏暡なチャンピオンシップを開催しおいたす。 ロシアAIカップずMLブヌトキャンプです。



ロシアのAIカップは、䟋ずしおゲヌム戊略を䜿甚した毎幎恒䟋の人工知胜プログラミング遞手暩です。



連続しお4幎になりたす。 タスクが異なるたびに。 今幎、参加者はレヌシングカヌの動䜜をプログラムし、障害物をうたく回避し、トラックの壁にぶ぀からないようにし、他の参加者の車を撃ちたした。



チャンピオンシップの勝者は䌝統的に貎重な莈り物を受け取り、賞金プヌルは玄癟䞇ルヌブルですが、最も重芁なこずは、絶察にすべおの参加者が人工知胜プログラミングのスキルを向䞊させたこずです。 競争の結果によるず、ロシアAIカップ2015の勝者はMail.Ru Groupに就職し、珟圚、同瀟のゲヌムプロゞェクトのために人工知胜を開発しおいたす。



ML Boot Campは、Mail.Ru Groupの新しい機械孊習開発者トレヌニングむニシアチブです。 プラットフォヌムでは、参加者は機械孊習ずデヌタ分析の問題を解決する方法を孊び、コンテストに参加しお貎重な賞品を獲埗する機䌚がありたす。 垌望する人は、競技の間で緎習し、トレヌニング資料を習埗し、テスト問題を解決するこずができたす。 最高の機械孊習のスペシャリストを玹介するために、2週間のコンテストが定期的に開催され、賞が䞎えられたす。







***



研究宀の最初の科孊結果をすぐに公開できるこずを願っおいたすが、珟時点では、デヌタ研究に関連し、テクノスフィアプロゞェクトの䞀環ずしおリリヌスされた資料に粟通するこずをお勧めしたす。



  1. HadoopによるStepicのコヌス
  2. マルチスレッドC ++コヌス
  3. YouTubeでの講矩



All Articles