SIBURのデータサイエンスに関するハッカソン:いかがでしたか

こんにちは



年の初め以来、私たちは全国で約10のハッカソンとワークショップを開催しています。 5月、 AIコミュニティとともに、「生産のデジタル化」の方向にハッカソン開催しました。 実稼働環境でのデータサイエンスについてはまだハッカソンを実施していないため、本日、それがどのようであったかについて詳細に話すことにしました。







目標は簡単でした。 原材料の供給から生産、直接販売までのすべての段階で事業をデジタル化する必要がありました。 もちろん、適用された性質のタスクは解決されているはずです、例えば:





そのようなタスクの主な価値は何ですか? そうです、可能な限り実際のビジネスケースに近づき、抽象的なプロジェクトではありません。 最初のタスクは、参加者の1人によってHabréですでに詳細に説明されています(David! そして、ハッカソンに課せられた2番目のタスクは、物流パークの鉄道車両の定期修理を組み合わせるプロセスを最適化する必要性でした。 これは、より理解しやすくするために、現在のバックログから直接取得し、参加者にわずかに適合させました。



だから、タスクの説明。



なすべきこと



ロジスティクスの専門家には特別なカレンダーがあり、定期メンテナンスのための車の発送に関する情報が含まれています。 ワゴンが2つ以上(2つ以上)あるため、従業員の作業を簡素化し、作業をより簡単に、より直感的にし、予備的なデータ分析に基づいて意思決定を迅速化するソリューションも必要です。



したがって、決定自体には2つのコンポーネントを含める必要があります。



  1. データ分析に基づく特別なアルゴリズム。
  2. 受信したデータとアルゴリズムの結果を明確かつ明確に視覚化できる便利なインターフェイス。 正確に何を実装するか(Web、モバイルアプリケーション、またはボットの助けを借りて)-参加者の裁量で。


入力データ



参加者に、修理のために18,000台の車を送信するためのデータセットを、すべての距離、タイミング、その他のデータ(数年間の情報)とともに提供しました。 さらに、ビジネスプロセスの担当者とライブでチャットし、必要な詳細をすべて明確にし、希望を収集する機会がありました。



さて、私は車の修理カレンダーとすべてをコンパイルしたように思えますが、ここで他に最適化できるものは何ですか? そして最も重要なこと-ソリューションの有効性をどのように、どのように測定するか?





スケジュールされた修理を最適化するための基準



ここで、車の修理は単なる車の修理ではないという事実から始める価値があります。 私たちの車はそれぞれ4種類の修理が可能です。





これら4種類の修理にはそれぞれ、修理自体の費用(修理資材+修理作業の支払い)と、修理の準備費用があります。 さらに、車をデポに配送する費用もかかります。 また、車は修理のために意図的に乗るので、空になります。つまり、ここでの旅行の利益を除外することを意味します。



もちろん、彼らは仮説から始めました。



仮説



仮説1 1日に複数の修理を組み合わせれば、準備作業を節約できます。



仮説は、「はい、それから私たちが同じ日に2回起きないように、修理のたびに他のすべてのことをしましょう」という形式の文を満たしました。



かっこいいですね。 場所によっては論理的です。 しかし、それほど単純ではありません。



修理(4つのうちのいずれか)には費用がかかるだけでなく、廃棄もあります。 一般的に、車と同様。 1月に検査に合格し、次の検査まで可能な限り長くドラッグして、最初の検査に費やした各ルーブルが効率的に使用されるようにしました。 リソースを開発せずにMOTを頻繁に行うと、お金を失います。



はい、車の例は私たちの例と完全には一致していません。それでも、状況は異なります。また、重要な長い旅行の前に、MOTを事前に(または年に2〜3回)行ってみる価値があります。 しかし、膨大な数の車の場合、そのような誤ったスタート修理はかなり深刻な損失をもたらす可能性があります。



仮説2 次に、これらの修理を単純に組み合わせて、それぞれの処分が可能な限り完了するようにします。



すでに良い。 質問があります:



修理のために車を送るほうが、どの駅からより利益がありますか?

各ステーションから私たちが知っているデポまでの経路。 しかし、ステーション間のパス自体はそうではありません。 車はもう少し貨物を輸送し、より遠い駅からデポに行くかもしれませんが、旅行で稼いだでしょうか?



仮説3。 ステーション間の距離と製品配送からの利益を考慮に入れます-修理のための発送の物流ポイントを最適化します。



仮説は単なる根拠のない声明ではなく、財務指標でより適切に表現されているということです。



つまり、ここでは、問題を解決するために、理想的には、これらのインジケーターを相互に最大限にリンクできるモデルを構築する必要があります。 同時に、入力パラメーター(修理のために送られた車の数、修理日、駅にいるなど)を変更し、実際のコスト削減を示すことができました。



そして再び、主なもの。 これは人々が一緒に働くプログラムです。 したがって、大量の金型やフィルタープレートではなく、人々のためのインターフェイスを作成する必要があります。 このインターフェースで作業する各従業員は、何が起こっているのか、この車がどこから来ているのか、どの車を組み合わせると考えられているのかを素早く理解する必要があります。

出発点として、参加者にいくつかのドラフトを示しました。 これは行動へのガイドではなく、単なる例でした。











ドラフトデザインスケッチ



参加者はすべてのスケッチと希望を受け入れ、考えを捨てました。



一定の明確化の形式で数日が経過しました-チームが私たちのところに来て、大まかなドラフトを示し、何かを明確にし、答えを得て、さらに決定を終えました。



実際、オーガナイザー側から見ると非常にクールに見えます-人々は外出先で創造的であり、新しい更新された導入ノートに適応し、数時間で独自のソリューションのいくつかの欠点を見つけ、すぐにそれらを排除します。 さらに、本格的なチームワークの形式で-このすべてのもののデザインを描きながら、データ科学者はすでに最初のスクリプトの作成を終了しています。



私たちは今、デジタル部門が同じ雰囲気の中で会社の日常業務に取り組んでいるようにしています。それは非常に刺激的だからです。



















デモとファイナルを見る



ここではすべてがシンプルでおなじみでした。 各チームの発言時間は5分で、主催者の回答時間は5分です。 もちろん、フレームワークはあまりきつくありませんでした。



このようなリズムのすべてについて、3時間を費やしました。







解決策を包括的に評価しました-一般的な問題解決のアプローチ、視覚化、現実の提案の適用性。 ここでは、AIコミュニティアプローチが役立ち、プロセスの中間結果も記録されました。







勝者



メイン賞(300,000ルーブル)はHack.zamAIチームに贈られました。



彼らは総合的なソリューションを作成し、財務パフォーマンスを最適化するだけでなく、製品に既製のビジネスプロセスを表示する追加のバンを多数作成しました。



同時に、それはまだまともでフレンドリーに見えます。















ここでは、ソリューションのデモを見ることができます。







(GoogleDriveのビデオ)



もちろん、これは最後のハッカソンではありません。



これに参加したすべての人に感謝します。 そして、必ず次の発表を投稿してください。



Dmitry Arkhipov、アーキテクト、プロセスのデジタル化、SIBUR



All Articles