検索のヒントが毎日あなたの人生を救う方法

検索のヒントは、Yandexに4年以上存在します。 プロのスラングでは、それらをサジェストと呼びます。 最初は、特定のリクエストの頻度に基づいてのみ形成されました。 時間が経つにつれて、私たちは質問がどの地域から尋ねられているのか 、それが最近のイベントに関連しているのか、ユーザーにサイトのアドレスをすぐに見せることができるのか、 そしてどの地域から さらに、既存の検索エンジンの最初で、Sugestがユーザーの以前のリクエストを考慮に入れてコンテキストヘルプを表示できるようにする技術を導入しました。 これで、検索ヒントがあなたとの対話に入り、検索した内容に応じて変わります。







Yandexのタスクは、質問の有無にかかわらず質問に答えることです。 検索-尋ねられた質問についてですが、ユーザーはそれらを作成するのに役立ちます。 結局のところ、1つの質問はさまざまな方法で定式化でき、多くの場合、その正しい定式化はより適切な答えを見つけるのに役立ちます。 これは、人が知らないトピックについて何かを探していて、十分な適切な用語がない場合に特に便利です。 または、たとえば、引用またはその著者を見つける必要があります。 人が常に正確に再現できるとは限りません。 「すべての芸術の代わりに、映画が私たちにとって最も重要」であり、「映画が私たちにとって最も重要なものだ」と書くと、ユーザーは必要な情報を受け取れない可能性があります。 ところで、彼は正しいオプションのヒントを見た後、さらに検索する必要はないかもしれません。 これは、サジェストがスペルミスを避けるのに役立つことは言うまでもありません。



しかし、検索のヒントの最も明らかな利点は時間の節約です。 最初の数文字の後に質問の文言が表示されたら、入力を続けずに使用します。 そして今、サジェストは多くのことを学んだので、時には検索結果ページに行く必要さえありません。



たとえば、検索ヒントは英語の単語の翻訳を表示できます。

Yandex検索のヒントの翻訳



または、明確な要求に答えます。

Yandexの検索のヒントにある明確なクエリへの回答



最近、データを調べて、興味深い事実を見つけました。 一緒に、人々は1日に1億のYandexの質問をします。 検索ヒントをオフにすると、これらすべてのユーザーは合計で60年を失います。 この時間は、要求の文言、修正の可能性、必要なものが見つからなかった後の新しい文言に費やされます。 ロシアの平均寿命を考慮すると、サジェストは毎日一人の男の人生を失うことを許さないことがわかります。



前のクエリを考慮した検索候補を使用すると、さらに7か月節約できます。 自分を見積もります。 人が[未来に戻る]を検索した場合、[連絡先]や[メトロマップ]ではなく[クリストファーロイド]を検索する必要があります。



以前の検索の検索候補

さらに、検索バーをクリックすると、指定されたサジェストも表示されます。 ロバートゼメキス映画の場合、最初の手がかりは[我々は未来からのものです]です。



検索ヒントの作成は、数学とコンピューターサイエンスを学んだ人にとっておそらく夢です。 ユーザークエリの分析に基づいて結論を出す能力と、特定のプログラミングスキルの両方が必要です。 結局のところ、スージェストは数百万の異なる言語のリクエストであり、そこからわずか数ミリ秒で着信リクエストに応答できるようなデータ構造を作成する必要があります。 これを行うには、すべてのリクエストをツリーに追加して、 ツリー内を非常にすばやく移動できるようにする必要があります。 次に、ヒントの作成で考慮に入れる多くの要因を考慮して、プレフィックスに最適な上位10のクエリを作成する必要があります。 たとえば、ユーザーの場所。 そして、前回のリクエストに応じて変更するためには、既存のデータ構造を変更する必要がありました。 そして、あらゆる種類の以前のリクエストを含む追加のツリーをまとめました。 それらの3000万人以上がありました。



その過程で、あらゆる種類の技術的に重要な決定を下す必要があります。 多くの開発者と同様に、使用する速度とメモリのバランスを常に探す必要があります。 私たちのタスクは、現時点で尋ねられている質問への回答をスピードアップすることでした。 これを行うために、考えられるすべてのプレフィックスに対して考えられるすべてのオプションを計算し、それらをほぼ完成した形でツリーに入れることにしました。 この場合、すでに説明した要因を考慮に入れて再配置するだけです。 そして、ロードしなかったことが判明しましたが、逆に、メモリを節約しました。



しかし、もちろん数学と統計学の分野の知識だけでは十分ではありません。 たとえば、同じケースでユーザーに一部の単語が同義語に置き換えられた同じ文を表示しないようにするには、それらをツリーで非表示にする必要があります。 それらを認識するために、言語学の成果も使用されます。 時間の経過とともに、さまざまな言語でヒントを表示することを学びました。



たとえば、日本語で

日本語でのYandex検索のヒント



またはアラビア語。

アラビア語のYandex検索のヒント







All Articles