MERC-2017コンテストの結果に぀いお受賞者ずのむンタビュヌ

Datacombats䌚堎でのNeurodata Labの MERC-2017コンテストの勝者ずファむナリストは、単なる非人栌的なリヌダヌボヌドラむンではありたせん。 これらは、さたざたな専門的および研究的関心、背景、および胜力を備えた若い専門家です。 最初のコンテストの歎史の最埌の仕䞊げずしお、むンタビュヌをするこずにしたした。 ブログの読者にずっお、この資料がコンテストの䞻催者ずしお私たちに出おきたように、反省の源になるこずを願っおいたす。

画像



ファむナリストの構成に予期せぬ倉曎があったこずをすぐにお知らせしたいず思いたす。1䜍ず2䜍は同じたたで、3䜍の勝者は以前はリヌダヌボヌドの4䜍だった参加者でした。 最初に3䜍になった参加者は、ルヌルで指定された時間内に賞品の支払いに必芁なデヌタを提䟛したせんでした。 はい、はい、私たちも驚きたした。



したがっお、最埌のTOP-3



1䜍 -tEarthDenis Vorotyntsev

2䜍 -10011000Pavel Ostyakov、Alexei Kharlamov



•Alexey基本的なパむプラむンの䜜成、仮説、反埩レむダヌずフレヌムワヌクの実装のテスト、ハむパヌパラメヌタヌの遞択、レベル2モデルのトレヌニング。

•Pavelパむプラむン最適化、モデルトレヌニング、デヌタ凊理アプロヌチのテスト。



3䜍 -FedotovDドミトリヌ・フェドトフ



受賞者に教育、将来の蚈画、決定の詳现に぀いお尋ね、たた新しいコンテストのアむデアを共有するように求めたした。



1.あなたの教育に぀いお教えおください。倧孊や専門分野の遞択に圱響を䞎えたものは䜕ですか どのようにしお機械孊習ずデヌタ分析の分野に来たしたか



Denis VorotyntsevMPEI、ラッペヌンランタ工科倧孊 私の母校であるモスクワ電力工孊研究所は、長い間、ラッペヌンランタ工科倧孊を含む倚くの教育機関ずの協力プログラムを持っおいたす。 フィンランドの関連分野で勉匷し、卒業蚌曞を曞く優秀な孊生が遞ばれたす。 私の意芋では、このような実践は、新しい経隓、知人、知識の面で孊生にずっおも、囜際協力や教育ず科孊の分野での経隓の亀換の面でも倧孊にずっお良いこずです。 これは、発芋ず改善の䜙地がある再生可胜゚ネルギヌのような画期的な分野にずっお特に重芁です。

科孊ずビゞネスの亀差点で興味深い問題を解決したいずいう願望に基づいお、私は高等教育機関を遞びたした。 6幎前のMPEIでの再生可胜゚ネルギヌ分野の人材育成は囜内で最高であり、時間が経぀に぀れお品質が向䞊するだけでした。 私の郚門である氎力発電ず再生可胜゚ネルギヌ源の郚門は、科孊的な仕事ず技術的な競争や䌚議ぞの参加の機䌚を提䟛したした。 これらの䌚議の1぀で、先週の倪陜光発電の生産を予枬する分野で行われた䜜業に関する報告ず、これが発電所の所有者および電力システム党䜓にずっおどれほど重芁であるかに぀いお報告したした。 提瀺された゜リュヌションは非垞にシンプルでしたが、それでも優れた粟床を提䟛したした。 その瞬間、私はより良いこずができるように思えたしたが、私の知識はハブに関するいく぀かの蚘事に限定されおいたした 圌は蚘事、曞籍、トレヌナヌの講座、edxの研究を開始し、Open Data ScienceODSコミュニティに参加したした。 1か月埌、「機械孊習」の最初のモデルを受け取りたした。線圢回垰は完党にmatlabで蚘述されおいたす。 ハハ

その埌、咳や類䌌のプラットフォヌムでの機械孊習に関する倚くのコンテストに参加したした。 平凡な結果は、たすたすやる気になりたした。 各コンペティションから新しいこずを孊び、次のコンペティションで䜿甚するために、リヌダヌボヌドトップず競争するために、matlabからRに、次にPythonに切り替えお、新しいラむブラリずテクノロゞヌスタックを詊しお、機械孊習トレヌニングずオンラむンコヌスを芋る必芁がありたした本や蚘事を読む。 圌らが蚀うように、じっず立぀ためには、あなたは玠早く前進する必芁がありたす。



Pavel / AlexeyHSEコンピュヌタサむ゚ンス孊郚 HSEは革新的な倧孊であり、優れた効果をもたらす技術ず叀い教育方法の優れた組み合わせを備えおいたす。 たた、機動性の向䞊、぀たり留孊する胜力、および远加のノンコア教育マむナヌを取埗する可胜性にも泚目する䟡倀がありたす。



ドミトリヌシベリア州立倧孊、りルム倧孊 珟圚、シベリア州立倧孊シベリア州立科孊技術倧孊、孊者M.F.レシェトネフ、クラスノダルスクにちなんでの倧孊院生であり、私は珟圚りルム倧孊ず䞀緒に博士論文に取り組んでいたす研究助成金。 ロシアの倧孊の専門分野-システム分析; ドむツ語では、通信技術むンタラクティブシステム。 圌はクラスノダルスクで自分の奜み、プロのトレンド、友人のアドバむスに基づいお方向を遞びたした。 2幎目からは、進化したアルゎリズムずニュヌラルネットワヌクテクノロゞヌの分野で科孊的研究を行い、埗られた知識をデヌタ分析の実際の問題に適甚したした。 2015幎に、圌はりルム倧孊の研究チヌムず協力しお感情を認識するタスクに取り組み始めたした。



2.競争に぀いおどのように知りたしたか 䜕に惹かれたしたか



Denis ODS slackのコンテストに぀いお読みたした。 コンテストの説明は次のようなものでしたビデオによる感情の認識。 それから非垞に耇雑に思えたした-ビデオの凊理、顔の怜出、顔からの特城の抜出、モデルの構築ずいう長いパむプラむンを考え出す必芁がありたす。 このような難しいタスクに取り組みながら、倚くの興味深いこずを孊ぶこずができたす 正盎なずころ、トレヌニングデヌタに匿名化された倉数があり、ビデオファむルのセットは芋られなかったので、少し怒っおいたした。 しかし、ただ創造的な仕事の䜙地がありたした。 興味深い問題を解決し、倚くのこずを孊んだので、結果に満足しおいたす。



Pavel / Alexey 圌らはサむトmltrainings.ruから孊んだ。 私は、暙準ではない蚭定、耇数のモダリティず同時に䜜業する胜力、新しいプラットフォヌムで他の参加者ず競争するずいう興味深いタスクに魅了されたした。



Dmitry AVECAudio / Visual Emotion Challengeコンテストに関する情報を芋お芋぀けたした。 コンテストでは、私に非垞に近いトピックず、いく぀かの䞍安定なモダリティず異なるサンプリングステップを持぀デヌタで問題なく動䜜できるシステムを開発するずいう圢での緊急のタスクに魅了されたした。



3.コンテスト䞭にうたくいかなかったアプロヌチやアむデアはありたすか 結果を改善するこずは可胜だず思いたすか



Denis 事情や怠、公共のリヌダヌボヌドでの自分の地䜍など、私が望むすべおを詊す時間はありたせんでした。 ビゞネスで同様の問題を解決するために、PCAたたはRandomForestを䜿甚しお重芁な属性を遞択するなど、ディメンションを瞮小する別の方法ず組み合わせおLTSMを詊しおみたす。 たたみ蟌みネットワヌク。 確かに、いく぀かの異なるモデルおよびデヌタ凊理ぞの異なるアプロヌチをスタックするず、粟床は向䞊したすが、実皌働環境でのモデルの䜿甚は耇雑になりたす。



Pavel / Aleksey 結果は間違いなく改善されたす。 さたざたな繰り返しセルずアヌキテクチャを詊すこずができたす。 たた、予枬を確率で平均するだけでなく、第2レベルのモデルを䜜成するこずもできたす。 このアむデアは良いですが、デヌタがない堎合は、再トレヌニングを克服するのに十分な時間を費やす必芁がありたす。



ドミトリヌ 競争の枠組みで解決したいが、時間がなかった根本的に異なるアプロヌチ-いいえ。 結果を改善できるず確信しおおり、この方向で䜜業するこずは確かです。 デヌタが欠萜しおいる感情のマルチモヌダル認識の実隓は、私の論文の䞀郚であり、䞻催者が提䟛するデヌタベヌスがこの基瀎ずしお䜿甚されたす。



4.なぜデヌタギャップの問題にほずんど泚意が払われなかったのか、それを解決しようずする他の方法は䜕ですか。



Denis平均倀による眮換 競争の初めに、2぀のアプロヌチを怜蚎したした1぀は、すべおのデヌタを単䞀のデヌタフレヌムで送信し、ギャップたたはある倀で眮き換えおモデルをトレヌニングするこずでした平均はクロス怜蚌で最高の結果を出したした 。

2番目のアプロヌチは、モダリティごずに独自のモデルを䜜成し、すべおのモデルを第2レベルのモデルず組み合わせるこずです。 ロゞスティック回垰が最高の第2レベルモデルになるず思われたした。 ただし、1぀ではなく耇数のモデルを䜜成する必芁がありたす省略の可胜性のある組み合わせに基づいお、そのようなモデルの理論では2 ^ 4-1 = 15でなければなりたせん。 ゚レガントな゜リュヌションではないように思えたので、長い匕き出しに入れたした。

最初の方法はリヌダヌボヌド䞊で良い䜍眮を䞎えたので、私は2番目の方法を詊したせんでした。



Pavel / Alekseyれロで眮き換える ゜リュヌションの䜜成䞭にいく぀かの基本的なアプロヌチがテストされたした平均倀、より高い倀、より䜎い倀など。ただし、れロの入力は速床の点でモデルにずっお最適であるこずが刀明したした。 そしお最終品質で。



Dmitryれロで眮き換える 䞍足しおいるデヌタの眮き換えず凊理の問題に倚くの時間を費やし、提出物の玄半分を費やしたした。 このような些现で興味のない方法の遞択は、明らかな利点ず䞀貫性にもかかわらず、他のすべおのオプションが粟床を向䞊させなかったずいう事実によっお説明されたす。 欠萜デヌタのアカりンティングのオプションのほずんどは、各モダリティの予枬が受信された埌、デヌタの埌凊理の段階でアプリケヌションが芋぀かりたした。 たずえば、最終予枬の蚈算時には、デヌタが利甚できないモダリティのみが考慮されたした。 䜿甚されたフレヌムの䜕パヌセントがれロでないかに応じお、蚈量予枬も適甚されたした。 たずえば、LSTMモデルで15個の前のフレヌムを䜿甚する堎合、最初の5぀はれロです。 この堎合、最終決定を蚈算するずきに予枬に0.66の重みが割り圓おられたす。 れロ以倖のデヌタでのみ、たたは重みを䜿甚しおモデルをトレヌニングする方法がテストされたした埌凊理オプションず同様。 説明されたオプションずそれに近いオプションはいずれも、テストサンプルの公開郚分で改善を瀺しおいたせん。 それにもかかわらず、このような凊理オプションを䜿甚するず、デヌタが欠萜しおいるモデルの粟床が向䞊するず確信しおおり、提䟛されたデヌタベヌスで機胜する方法を匕き続き怜玢したす。



5. TOP-3のすべおの参加者が、いわゆる決定朚XGBoostなどたたはLSTMを優先しお遞択したこずに驚きたした。 䜕があなたの遞択を決めたしたか



DenisLightXGB 募配ブヌスティング法は、数幎前のSVMのような機械孊習の珟代的な「黄金のハンマヌ」であるず蚀えたす。 ニュヌラルネットワヌクず比范しお、「すぐに䜿える」䜿いやすいので、デヌタの前凊理に぀いお考える必芁はありたせん。欠損倀の入力ずカテゎリ倉数の操䜜です。 しかし、圌らが蚀うように、無料のランチはありたせん。優れた結果を達成するには、倚くのオプションを詊す必芁がありたす。 この競争では、最倧の結果は、遞択したトレヌニングモデルではなく、結果のデヌタの前凊理および埌凊理予枬確率の平滑化の戊略に関連付けられおいたした。



Pavel / AlekseyLSTMモデルのアンサンブル リカレントニュヌラルネットワヌクを遞択したのは、類䌌したコンテンツのデヌタシヌケンスを操䜜するための最も匷力なツヌルだからです。 もちろん、デヌタセットにビデオからの正盎な画像が含たれおいる堎合、畳み蟌みLSTMネットワヌクを䜿甚するず、はるかに良い結果を埗るこずができたす。



Dmitry少数のパラメヌタヌを持぀lstm 正盎なずころ、このコンテストのフレヌムワヌクでは、さたざたなモデルのテストではなく、デヌタ凊理に焊点を圓おたした。 最初の提出は、以前に䜿甚したLSTMモデルを䜿甚しお行われ、それぞれ24局ず12局の2぀のLSTMブロックが䜿甚されたした。 このモデルの結果は0.537852で、すぐに2䜍になりたした。 その埌の提出では、2぀のモデル倉曎のみを行いたした。リカレントニュヌラルネットワヌクのサむズを2倍12-6ブロックに瞮小し、レむダヌを双方向にしたした。 モデルではなく、デヌタの前凊理ず埌凊理の粟床を高める倧きな可胜性を芋出したした。



6.このコンペティションから䜕か圹に立぀/面癜いこずを孊びたしたか どの方向に進む予定ですか



デニス 間違いなくはい。 デヌタを芖芚化し、次元を枛らすためにさたざたなアプロヌチを詊みたした。 圌らは結果を改善する助けにはなりたせんでしたが、さらなる仕事に必芁な思考ずかけがえのない経隓のために食物を提䟛したした。 珟圚、私はすべおの競技で剣闘士ずしお戊い、コンピュヌタヌビゞョンタスクを優先したいず考えおいたす。



Pavel / Aleksey はい、競争は、反埩モデルの再蚓緎ずの戊いで埗られた倧量の経隓の圢で非垞に有甚であるこずが刀明したした。たた、蚓緎のための䞍十分なデヌタの条件でレベル2モデルを構築するためのさらなる䜿甚もありたした。



Dmitry 欠萜したデヌタをマルチモダリティで扱うための経隓ずアむデアを確かに匕き出したした。 実際の条件でデヌタを収集する堎合は垞に発生したすが、デヌタの欠萜の問題にはほずんど時間がかかりたせん。 たずえば、最近、同僚ず私は感情を認識するためのプロゞェクトのデヌタを収集したした。モダリティの1぀は目の動きず芖線の方向でした。 これらの目的のために特別に蚭蚈されたこのデバむスは、照明の急激な倉化や明るい日光に照らされたずきにデヌタを収集する機胜を倱いたした。 他のセンサヌも短期的な䞭断を匕き起こしたした䞻に攟出の圢で。 この堎合、コンペティションで提瀺された状況ず同様の状況があるため、取埗した知識は実甚的な芳点で非垞に有甚であるず思いたす。

将来的には、欠萜デヌタにもっず泚意を払いながら、感情認識システムの開発に取り組み続けたす。



7.次のコンテストのいずれかで音声凊理に焊点を合わせる可胜性を排陀したせん。 この分野のどのような問題を解決したいですか コンテストやコンテストに興味がある他のトピックは䜕ですか



デニス 感情に関連するものはすべお興味深い仕事ですが、それに察する競争はほずんどありたせん。 音声凊理は䞀般的に爆匟です



Pavel / Aleksey 1スピヌチによる人の気質の刀定、2スピヌチによる人のパニック状態の刀定、3嘘発芋噚。



Dmitry 音声凊理のトピックは私にはあたり䌌おいないので、この質問に答えるのは難しいです。 感情認識コンテストに興味がありたす。 特に、゜ヌシャルネットワヌクからのデヌタテキスト、写真、ビデオに基づいお、実際の条件に近いタスクを確認したいず思いたす。



音声凊理の面に暪たわる、たたは感情や行動の認識に関連するコンテストの独自のアむデアもある堎合は、コメントで共有しおください。



投皿者

Alexandra Smirnova、クラりド゜ヌシングプロゞェクトず倖郚関係の専門家Neurodata Lab



All Articles