機械孊習お金はどこですか

機械孊習は珟圚トレンドになっおいたすが、商甚アプリケヌションに関しおのみ、倚くの疑問が生じたす。 そのため、答えがある人を芋぀けたした。 1C-BitrixのAlexander AlexSerbul Serbulず話をしたした。圌は、機械孊習を䜿甚しおビゞネス䞊の問題を解決し、ディヌプラヌニングの誇倧広告の理由ず、ナヌザヌや䌁業にずっおのチャットボットの利点に぀いお話したした。 そしお、アナスタシア・ダニヌナ・ダナスティヌアはこの䌚話で私たちを助けおくれたした。 詳现に぀いおは、猫ぞようこそ。











Alexander Serbulは、ビッグデヌタ、゜フトりェア開発、システム分析、蚭蚈の専門家です。 1C-Bitrixで、圌は統合ず実装の品質管理の方向を監督し、高ワヌクロヌドずフォヌルトトレランスに関連する䌁業プロゞェクトBitrix24のアヌキテクトおよび開発者ずしお積極的に参加し、1C-Bitrix補品のクラスタリングテクノロゞヌの効果的な䜿甚に぀いお、パヌトナヌおよびクラむアントにアドバむスしたす最新のクラりドサヌビスAmazon Webサヌビスなどのコンテキストで。





-機械孊習を始めたきっかけは䜕ですか



Alexander Serbul誇倧宣䌝の結果、機械孊習に来たした。 私は経隓豊富な゚ンゞニアですが、数孊教育や科孊の孊䜍は持っおいたせん。 機械孊習が実際のビゞネス䞊の問題の解決にどのように圹立぀のかず思っおいたした。 埐々に、私は関䞎し、アルゎリズムず基本的なアプロヌチを理解したした。すべおの数孊ず䞀般的なラむブラリを䜿甚したした。



珟圚、機械孊習アルゎリズムを積極的に䜿甚しお、適甚された問題を解決しおいたす。 私たちの䞻な目暙は、クラむアントができる限り効率的に問題を解決できるよう支揎するこずです。 したがっお、ビゞネスケヌスを解決するために簡単か぀迅速に適甚できるアルゎリズムに最も関心がありたす。 ここには非垞に実甚的な関心がありたす。



-AI、ディヌプラヌニング、ビッグデヌタの領域を監督したす。 機械孊習を䜿甚しお解決した䞻なタスクに぀いお教えおください。



Alexander Serbul公匏には、品質管理ず実装の統合の方向性を監督しおいたすが、それに加えお、ビッグデヌタ、機械孊習ディヌプラヌニングを含む、人工知胜の分野で数幎間働いおいたす。



私たちはいく぀かの分野で働きたした。 機械孊習の適甚に成功した最初のものは、オンラむンストア向けのパヌ゜ナラむズされた掚奚事項です。 いく぀かの掚奚サヌビスをリリヌスしたした。 最初に䜿甚されたのは協調フィルタリングです。 ほずんどの店舗では、アルゎリズムが「りォヌムアップ」する必芁があるため、このアプロヌチはあたりうたくいきたせんでしたコヌルドスタヌトの問題が発生したした。 さらに、異なるストアにある同じ補品を異なる方法で呌び出すこずができ、アルゎリズムはこれらが異なる補品であるず芋なしたす。 この問題を解決するために、商品のクラスタリングを適甚し始めたした。぀たり、同じ補品の異なるバヌゞョンの蚘述を1぀に圧瞮したした。 これはそれほど単玔ではありたせん。デヌタベヌスには数千䞇の補品がありたす。 この問題を解決するず、掚奚事項の品質が数十パヌセント向䞊したした。



さらに、ABテストを実斜するこずにより、掚奚システムを改善するこずを決定したした。 Bitrix補品でABテストを実斜するためのツヌルを実装したした。 その結果、䞀連のテストずその結果の分析の埌、掚奚モデルを簡玠化し、コンテンツベヌスのアプロヌチを基瀎ずしお採甚したした。 ナヌザヌがアクセスしたサむトに応じお、ナヌザヌの関心のプロファむルを䜜成したす。 そうすれば、ある人が店に来るず、どの補品が圌にずっお興味があるのか​​、そうでないのかを理解できたす。



このようにしお、個人的な掚奚のシステムの3段階の進化が埗られたした。 ロシアでは、誰もそのような報道をしおいたせん。私たちが協力しおいるオンラむンストアのデヌタベヌスは非垞に倧きいです。



その埌、マヌケティングの予枬分析を含め、瀟内で機械孊習を䜿甚したした。 圌らは、どの顧客がサヌビスの高床な䜿甚にすぐにお金を払い始めるか、アプリケヌションを䜿甚する期間を予枬するモデルを䜜成し、芖聎者の流出を予枬するこずも孊びたした。 次に、ナヌザヌのポヌトレヌトをコンパむルし、関心のある補品に応じお顧客をクラスタヌ化するモデルを䜜成したした。



-ファッショナブルな今のディヌプラヌニングはどうですか 深いネットワヌクをトレヌニングする必芁があるプロゞェクトがありたしたか



Alexander Serbul昚幎、人工知胜ずディヌプラヌニングのトピックを積極的に掘り䞋げお、チャットボットを䜜成しおいたす。 モスクワ垂庁舎ず䞀緒にパむロットを䜜りたした。 トレヌニング察象のデヌタセットは、50䞇の質問ず回答で構成されおいたした。 開発はパむロットほど進んでいたせんが、品質は正垞でしたが、粟床は玄75でした。 それほどクヌルではありたせんが、それでもなお、チャットボットにより、人々は質問に察する回答をより迅速か぀効率的に芋぀けるこずができたした。



-チャットボットに぀いお話し始めおから、iPavlovのメンバヌが䜜成するテクノロゞヌに぀いおどう思いたすか あなたの決定はそれらず根本的に異なりたすか



Alexander Serbul私は圌らの補品に぀いお読んでいたすが、率盎に蚀っお、チャットボット業界の機械孊習は必芁なビゞネス品質を提䟛できないず思いたす。 このようなアルゎリズムは、これたでのずころ、ビゞネスよりも高床な研究ず科孊により関連しおいたす。 Chatbotはアシスタント、アドバむザヌずしお機胜したすが、暙準のコヌルセンタヌやテクニカルサポヌトに代わるものではありたせん。 今日、ボットが効果的に人々を眮き換えるこずができるずは思わない。 ディヌプラヌニングは、ボットをよりスマヌトにするのに圹立ちたした。 今では、狭い問題ピザの泚文などを圌らの助けを借りお解決するこずはかなり可胜ですが、それでもボットずの察話を行っお意味のある答えを埗るこずができたせん。



ただし、ニュヌラルネットワヌクの進歩は驚くべきものです。 ニュヌラルネットワヌクは、人間よりも優れた画像の分類、写真の倱われた郚分の回埩、顔の認識などを行うこずができたす。 これらの結果は驚くべきものであり、機械孊習の分野ではたもなくブレヌクスルヌずなる鐘ずしお機胜したす。 あなたは脈動に指を保぀必芁がありたす



機械孊習が掻発に開発されおいるため、私はこの分野が奜きです。 開発者にMLアルゎリズムの䜿甚方法を教え、マネヌゞャヌに必芁な知識ベヌスを提䟛する必芁がありたす。圌らはロゞスティック回垰ずは䜕かを少なくずも指で説明できるようにしたいのです。 科孊ずビゞネスの間には倧きなギャップがありたす。科孊がビゞネスに参入し、ビゞネスはこれにたったく察応しおいたせん。 機械孊習では、革呜が埅っおいたす。ニュヌラルネットワヌクの3番目の波は、すでに本圓の接波になりたす。 さらに興味深いこずになりたす



-珟圚、ニュヌラルネットワヌクの呚りには本圓に倚くの誇倧宣䌝があり、ほずんどすべおの機械孊習タスクでそれらを䜿甚しようずしおいたす。 あなたは圌らの巚倧な人気に関連しおいるず思いたすか



Alexander Serbulもちろん、これは、ディヌプネットワヌクを適切にトレヌニングする方法を孊んだずいう事実によるものです。 このための゜フトりェアがあり、鉄GPUが登堎したした。 䞀郚の地域たずえば、自走車では、人間をニュヌラルネットワヌクに基づくアルゎリズムに眮き換えようずしたした。 これはすべおコンピュヌタヌ化のこずを思い出させたす。コンピュヌタヌの自動䌚蚈、銀行業務の助けを借りお。 しかし、すべお同じように、人々は座っお玙片を仕分けおおり、䞀郚の銀行では「カヌドを開いおそこに行く」ずいう原則が䟝然ずしお機胜しおいたす。 ルヌチン䜜業は終了しおいたすが、非垞に遅いです。



2番目の重芁な理由は、倧きなデヌタセットが登堎したこずです。 ビッグデヌタの可甚性ずビッグデヌタ凊理甚の鉄の可甚性により、深いネットワヌクを䜿甚しお玠晎らしい結果を埗るこずができたす。



3番目の理由-科孊者はニュヌラルネットワヌクにより積極的に関䞎するようになりたした。 リカレントネットワヌクが登堎し、畳み蟌みネットワヌクの分野の研究が倧幅に進歩したした。



しかし、それにもかかわらず、この誇倧広告の根源は、こうしたテクノロゞヌに察するベンダヌの関心です。 たずえば、コンテキスト広告の有胜な仕事により、倧きな利益を埗るこずができたす。 したがっお、GoogleやFacebookなどの倧芏暡なITの巚人は、ディヌプラヌニングの分野の研究にお金を費やし、有力な科孊者を雇い、この分野の発展のための条件を提䟛するこずが有益です。 高床な技術の開発に貢献するこずで、科孊の最先端を動かすだけでなく、䜕癟䞇もの収入を埗おいたす。



-ビゞネス䞊の問題を解決するためにニュヌラルネットワヌクアヌキテクチャを遞択する方法は 良いニュヌロンを「調理」する方法に関する普遍的なレシピはありたすか



アレクサンダヌ・セルブル実際、レシピはありたせん。 ニュヌラルネットワヌクの孊習は䟝然ずしお芞術のようなものです。 ネットワヌクの初期化の問題も未解決のたたです。倚くの方法があり、どのタスクが特定のタスクに適しおいるかは明確ではありたせん。



ただし、さたざたな本で説明されおいる䞀般的なアプロヌチがありたす。 私のお気に入りは本です。I。Goodfellow、Y。Bengio、A。Courville こちらからダりンロヌドしおください 。実甚的なタスクのためにニュヌロンのトレヌニングを開始し、盎芳を開発するこずです。ニュヌラルネットワヌクTensorFlowなどのフレヌムワヌクには、䟋ず既補のアヌキテクチャがありたす。座っお詊しお理解する必芁がありたす。



-プロゞェクトでニュヌラルネットワヌクの実装を開始するには、どのような知識が必芁ですか ディヌプラヌニングのためのラむブラリのコヌディングスキルず知識は十分ですか



Alexander Serbulそのような䜜業は、通垞のプログラマヌではなく、適切な教育を受けた人々によっお実行されるべきです。 開発者の目暙ず目的はわずかに異なりたす。本番甚に研ぎ柄たされた適切なコヌドを蚘述し、バグをすばやく芋぀け、テストを䜜成できる必芁がありたす。 優れたコヌドを曞くこずも芞術です。圌らはこれを䜕幎も孊習しおいたす。 ニュヌラルネットワヌクのトレヌニングは、業界の人ではなく、研究者の仕事です。 埮劙な点がたくさんありたす。垞に本を読んだり、新しく出版された蚘事を監芖したり、自分で蚘事を曞いたり、同様の科孊的関心分野の人々ずコミュニケヌションをずる必芁がありたす。



-しかし、既補のフレヌムワヌクず機械孊習ラむブラリsklearnなどはどうでしょうか 内郚の数孊を完党に理解しないず、圌らず䞀緒に仕事をするこずはできたせんか



アレクサンダヌ・セルブルもちろん違いたす 。 少なくずも理論の基本原則を理解しおいなければ、これはすべお掚枬です。 機械孊習ラむブラリの効果的な䜿甚を開始するには、資栌のある専門家であり、優れた数孊的基盀を備えおいる必芁がありたす。 レベル95のクリンゎン語“ terver”、matがありたす。 統蚈、線圢代数。 倚くの開発者はこれをすべお知っおいるわけではありたせん。 もちろん、特別な知識がなくおも「sklearnからRandomForestをむンポヌト」するこずはできたすが、数孊の知識がたったくないデヌタサむ゚ンティストはそう遠くなりたせん。



すべおの機械孊習は数孊で飜和しおいたす。 音楜のようなものです。音笊を知らずにどうやっお挔奏できたすか 移行䞭に螊る3぀のコヌド、それだけです。 本物の音楜には゜ルフェゞオが必芁です。 もちろん独孊もありたす。 私は数孊的教育を受けおおらず、これはひどい苊痛をもたらしたした。 機械孊習に関する本を開くず、最初のペヌゞから「固有ベクトル」、「固有倀」、「事前確率」が衚瀺されたす。 私は自分でそれを理解し、本を読み、倚くの時間を費やさなければなりたせんでした。



-ツヌルの遞択はどうですか プログラミング蚀語ずしお、Pythonのみを䜿甚し、ニュヌロンのトレヌニングには䞀般的なフレヌムワヌク同じTensorFlowを䜿甚したすか



Alexander Serbulはい、TensorFlowは間違いなく人気がありたす。 それでも、ニュヌロンをトレヌニングするためのテクノロゞヌずプログラミング蚀語の遞択は未解決の問題です。 私自身、ニュヌラルネットワヌクのトレヌニング甚のJavaコヌドを䜜成したした。 Javaテン゜ルラむブラリND4Jを芋぀けたした。 私は自分で差別化を曞きたした、準備ができおいたせんでした。 このニュヌラルネットワヌクは珟圚、技術サポヌトのために本番環境で機胜しおいたす。 うたく動䜜し、安定し、高速で、信頌性がありたす。 品質はビゞネスに適しおいたす。埓業員の䞀郚をニュヌロンに眮き換えたした。



-ディヌプラヌニングに加えお、ビゞネスケヌスを解決するためにどのアルゎリズムを䜿甚したすか



Alexander Serbulニュヌラルネットワヌクだけではありたせん。 ニュヌロンは通垞、より単玔なアルゎリズムの動䜜が䞍十分な堎合に䜿甚されたす。 ランダムフォレスト、SVM、ロゞスティック回垰、線圢モデル、決定朚などのさたざたなアルゎリズムを䜿甚したす。 独自のツヌルを遞択する必芁がある各タスクに぀いお、倚くはデヌタに䟝存したす。 珟圚、たずえば、YandexはCatBoostラむブラリをリリヌスしおいたす。 アルゎリズム自䜓募配ブヌスティングは長い間発明されたしたが、ニュヌラルネットワヌクよりも悪くない倚くのタスクで機胜したす。 CatBoostを䜿甚しおみたしたが、結果に非垞に満足しおいたす。



-十分な知識ずスキルがあったずしおも、プロゞェクトを収益化するこずは困難です。 緎習の秘密、補品の販売方法たずえば、機械孊習の問題を解決するための適切に調敎されたモデルを共有したすか



アレクサンドル・セルブル今、䜕が売れおいるのですか 特定の問題を迅速か぀適切に解決する正確なアルゎリズム。 私の意芋では、成功には3぀の䞻芁な芁玠がありたす。



第䞀に、補品は、圌らが蚀うように、゚ンゞンオむルの痕跡がないはずです。 残念ながら、垂堎に出回っおいる補品のほずんどはバグが倚いか、速床が䜎䞋しおいたす。 これは、䜜成者が優れたプログラマヌを節玄したこずを意味したす。 たたはテスタヌで。 たたは、マネヌゞャヌはたったく仕事に察凊できたせん。 さらに、倚くの堎合、意思決定には耇雑な問題が発生したす。30のフレヌムワヌクを䜿甚するため、2か月間最小限の倉曎を行った埌、バグを探したす。 補品は正しく簡単に動䜜するはずです。 技術の卓越性は非垞に重芁です。



第二に、どの補品にもビゞネス䞊の枬定可胜性が必芁です。 人工知胜の販売方法は 補品の品質保蚌を販売するには、それを枬定しお販売する必芁がありたす。 目暙を明確に蚭定する必芁がありたす「コストを10削枛する」たたは「チャットボットを実装し、それらの効率を高める」。 20サポヌト。」 タスクは数孊的に䞍明確に蚭定するこずができたす。マネヌゞャヌずアナリストのタスクは、ビゞネス芁件を科孊的に理解可胜な問題に、そしお研究成果をビゞネス的に理解可胜なモデルに倉えるこずです。



第䞉に、迅速なプロトタむプを䜜成する必芁がありたす。 Tinkoff銀行は、圌らが䜜った10個のモデルのうち、離陞するのは1〜2個だけだず蚀われたようです。 チヌムの研究責任者が顧客のデヌタにアクセスできるこずも重芁です。 デヌタ収集には倚くの泚意が必芁です。



-より収益性の高いものスタヌトアップモヌドでアむデアを宣䌝したり、倧䌁業ず協力しようずしたりしたすか



Alexander Serbul私はよくスタヌトアップモヌドで働きたした。 たずえば、WebスタゞオQsoftで。 䞀時、Eldorado.ruを立ち䞊げたした。 私自身の経隓から蚀えば、スタヌトアップモヌドで䜜業する方がはるかに効率的です。 人々は速く孊び、補品の䜜成に情熱を傟け、「アむデア」のために深倜たたは週末に働くこずができたす。

小さな䌚瀟では、誰もがお互いを知っおいたす。



倧䌁業は通垞、「玉座のゲヌム」です。プロモヌション、ボヌナス、担圓者などです。 退屈になり、すべおのタスクがやり盎されたすが、新しいタスクを取埗しお再び定型的な仕事をしたくありたせん。 もちろん、そのような堎所ではありたせん。 しかし、私はスタヌトアップモヌドで䜜業する方がずっず快適です。



-最埌に、あなたの意芋では、機械孊習はどの方向に発展し続けたすか ニュヌラルネットワヌクは、日垞業務を解決する胜力においお人々を凌ぐでしょうか



アレクサンダヌ・セルブル人々は人間に匹敵する人工知胜の粟床に期埅しおいたすが、これたでのずころ、これはかなり狭いタスクでしか達成できたせん。 䞀般的に、人工知胜は人間に劣りたすが、その䜿甚には倧きな展望がありたす。 機械孊習をビゞネスに積極的に導入する前に、分析ず蚈算の文化を浞透させる必芁がありたす。補品の有効性を蚈算する方法を孊ぶ必芁がありたす。 これたでのずころ、十分な粟床を持぀ビゞネスパフォヌマンスを蚈算するためのモデルすらありたせん。 予枬機械孊習は、そのようなモデルが存圚する䌚瀟のスキヌム、および十分に開発された分析、ABテストのシステム、統蚈収集などに適しおいたす。



私は機械孊習が奜きです。なぜなら、珟圚この分野は掻発に発展しおいるからです。 開発者にMLアルゎリズムの䜿甚方法を教え、マネヌゞャヌに必芁な知識ベヌスを提䟛する必芁がありたす。圌らはロゞスティック回垰ずは䜕かを少なくずも指で説明できるようにしたいのです。 科孊ずビゞネスの間には倧きなギャップがありたす。科孊がビゞネスに参入し、ビゞネスはこれにたったく察応しおいたせん。 機械孊習では、革呜が埅っおいたす。ニュヌラルネットワヌクの3番目の波は、すでに本圓の接波になりたす。






機械孊習の䜿甚に関するさらに倚くの事䟋の詳现を知りたい堎合は、10月のSmartData 2017カンファレンスで、Alexander Serbulの講挔「 Eコマヌスでの応甚機械孊習パむロットず戊闘プロゞェクトのシナリオずアヌキテクチャ 」をお読みください。 圌に加えお、次のようなさたざたなレポヌトを含む16人のスピヌカヌがいたす。

-Neuronaなぜニュヌラルネットワヌクに、Kurt Cobainのスタむルで詩を曞くように教えたのですか Ivan Yamshchikov、Max Planck Institute、ラむプツィヒ、ドむツ/ Created Labs

- ディヌプラヌニング画像内のシヌンずランドマヌクの認識 Andrey Boyarov、Mail.Ru Group

- 深局孊習、確率的プログラミング、メタ蚈算亀点 Alexey Potapov、ITMO



All Articles