ウィキペディアは人工知能を使用して、マテリアルエディターの数を増やします





ウィキペディアは、誰でも変更できるオンライン百科事典です。 クラウドソーシングに関しては、非営利の百科事典サイトの作成により、ユーザーが情報を検索するプロセスが一変しました。 ウィキペディアは、多くの巨大な百科事典に取って代わる、最も訪問された10のインターネットサイトの1つです。 しかし、彼女には欠点があります。 誰でもウィキペディアに変更を加えることができる場合、誰でも誤った情報を誤って追加する可能性があります。 また、誤ったデータを意図的に追加することで、だれでもサイトを傷つけることができます。 ウィキメディア財団(ウィキペディアはこの組織に属しています)に勤務するアメリカのコンピューター科学者であるアーロン・ハーフカーは、そのような破壊行為を検出するために独自のAIシステムを作成しました。



「荒らしのライオンのシェアは機知に富んだものではないことが判明しました。」



ある意味で、これはウィキペディアの記事をチェックするボランティアの編集者にとって作業を簡単にすることを意味します。 そして、これはこれらの編集者のサービスを放棄するための別のステップのように思えるかもしれません(AIが人間の仕事に取って代わる方法の別の例)。 しかし、Halfbackerプロジェクトは、ウィキペディアの構築に対する人間の貢献を増やす試みである可能性が高いです。 また、AIとロボット工学が今後20年間で人件費の47%に取って代わると予測する人もいれば、AIがそのようなシステムをサービスするための新しい専門分野も作成すると確信している人もいます。 同じプロジェクトは、少なくともこのような傾向の小さな例です。



ウィキメディアのリサーチディレクター、ダリオ・タラボレッリは、「このプロジェクトは、必要な場所に人間の注意を引くために、人間の労働を再関与させる試みです」と述べています。



初心者を怖がらせないでください



過去に、重要なウィキペディアの記事の1つを変更しようとした場合、拒否の自動応答を受け取ることがよくありました。 ユーザーが明確なルールに従わなかった場合、システムは百科事典の作成に参加することを許可しなかったため、Halfakerや他の科学者による調査の結果によると、これにより多くの人々がWikipediaの編集という考えを放棄しました(そして、彼らは永久的な編集者になる可能性があります)。 2009年の調査では、プロジェクトの立ち上げから8年後、人々はますますそのプロジェクトに参加するようになりました。



「これは、新参者が私たちと一緒にいないためです」とHalfaker氏は言います。 「実際、ウィキペディアでは、新しい百科事典の編集者が、サービスに来る破壊者や不必要な人々との戦いの効果について得ることができる経験を交換しました。」



このAIプロジェクトの問題に関して、Objective Revision Evaluation ServiceまたはORESはHalfeker氏の意見を反映しており、彼の主な目標は、Wikipediaを新しい編集者にとってより楽しいものにし、人々がWikipediaの生活に積極的に参加することを奨励することであると信じています。 SciKit Learn(すべてのユーザーが利用できる無料のコード)と呼ばれる一連のオープンソースの機械学習アルゴリズムを使用して、サービスは明白な破壊行為を自動的に認識し、善意で行われた変更からそれを分離したいと考えています。 行われた変更をより詳細に知ることで、これらのアルゴリズムは潜在的なアクティブな参加者を怖がらせることなく破壊者を識別できます。 これは、ウィキペディアがより多くの編集者を引き付けるために自動化ツールを必要とすることを意味しません。 結論として、ウィキペディアには最高の自動化ツールが必要です。



「変更が善意によるものか悪意によるものかによって、アプローチは異なるはずです」と、ミネソタ大学のコンピュータサイエンス学部で博士論文のテーマとしてウィキペディアを使用したHalfaker氏は言います。



グローバルに見ると、AIアルゴリズムは機械学習の単なる例です。 しかし、それらは非常に効果的です。 彼らの仕事は、特定の単語、特定の単語の組み合わせ、または特定のキーレイアウトを認識することです。 たとえば、非常に大きな文字のブロックをキャプチャできます。 「バンダルには、スペースなしですべてを連続して入力する傾向があります」とHalfaker氏は言います。



彼は、このサービスが現在サイト上の破壊行為のすべてを検出できるわけではないことを認めていますが、それらのほとんどを見つけることを望んでいます。 「このような戦略では、うまく書かれたナンセンスを追跡することはできません。 しかし、破壊行為のライオンのシェアはオリジナルではないことが判明しました。」



自分で書いたウィキペディアの記事?



一方、Google、Facebook、Microsoftなどの大手企業は、ディープラーニングと呼ばれる新しい機械学習技術を開発しています。 ニューラルネットワーク(人間の脳のニューロンのネットワークに類似したマシンのネットワーク)を使用して、ディープラーニングアルゴリズムは写真を認識し、音声で言葉を「理解」し、ある言語から別の言語に翻訳できます。 たとえば、そのようなネットワークは、犬の写真をアップロードすることで、犬を認識するように教えることができます。



これらの同じアルゴリズムを使用して、科学者は自然言語を認識するシステムの開発を開始します-人々が毎日話したり書いたりする方法。 このようなネットワークに大量のダイアログを「フィード」すると、会話を続けるようにマシンに教えることができます。 膨大な数のニュース投稿を知ってもらうと、マシンに自分で記事を書くように教えることができます(これはまだまだ先の話です)。 そしてこれは、マシンがウィキペディアを自分で編集できる未来を決定する要因の1つかもしれません。



Halfakerは、私たちがまだそのような未来から非常に遠いと確信しています。 そして、それが来たとしても、彼によると、ウィキペディアにはこれらのネットワークを指揮できる人が必要だという。 「機械が人の意見を上回ることができる時が来るのか、それともそうすぐには来ないのかはわかりません」と彼は言います。 「しかし、それでも、人間の意見がこのプロセスの一部であることを望んでいます。」 そして彼は、ウィキペディア編集者の軍隊を増やすことができるAIサービスを作成しました。



彼とウィキメディア財団はこれらのアルゴリズムを実装しておらず、より広いウィキペディアコミュニティで使用できるオンラインサービスとして提供しています。 「アルゴリズムを実験し、批判するのが簡単になりました」とHalfaker氏は言います。 「ダイアログを作成して、新しいコンテンツに対処し、新しい方法を使用し、新しい編集者と協力するという未来に向けて移行できるようにしたいと考えています。」 これはAIです。 しかし、繰り返しますが、これは「人間」の原則と完全に一致しています。



All Articles