認識エラーのトレースに従う

軍隊での呼び出し

-イワノフ!

-私!

-ペトロフ!

-私!

-30〜30!

-???

-三十三、そこにありますか???

-同志中Li! 私の姓はゾゾです。



冗談。



私たちは皆、文書認識プログラムが時々ミスをすることを知っています。 確かに、それらが間違っていなければ、テキストエディターを備えた分岐ユーザーインターフェイスは必要ありません。 残念ながらFineReaderも例外ではありませんが、それはポイントではありません。 エラーの多くが存在するため、認識プログラムはかなり前から存在していました...デジタル化された本の中で「道を行く」というフレーズに出会っていない人は誰ですか? 今日、これらのかわいい認識者のいたずらを見て、それらが最終的に観察可能なオブジェクトとしての私たちの言語にどのように影響したかを見てみましょう-統計的に知覚可能な異常に気付いてみましょう。 はい、もちろん、真剣な言語学習により、言語学者はおそらく穀物をもみ殻から分離することができるでしょうが、ご存知のように、もみ殻も非常に興味深いものです。



すぐに予約します。 発見された異常のすべてがFineReaderに由来するわけではありませんが、彼は多くの手を携えました。 それでは始めましょう。



かわいいキャラクター、犬のファフィクから始めましょう。 「偉大な、中型、そして犬のファフィクの思考」について聞いたことがあるでしょうか? ビルドできることがわかりました。 クエリ "building fafiki"(引用符なし)には、3.5万を超えるGoogleのコストがかかります。 この特別な「コンピューターprofamma」に使用されます(引用なしの3,000を超えるgoogle)。 ただし、明確化されていない「プロママ」は、11,000ものGoogleを獲得しています。 「忘れられない」という素晴らしい言葉は遅れをとっています-ほんの千以上。



スクラブルのプレイヤーに愛されている「pa」という言葉を覚えていないのはどうしてですか? 特に今日よく使われています。 たとえば、「背景に対して」(引用符で)は5.5 000のGoogleを収集し、「テーブルの上で」(引用符でも)-約3,000、「手で」(引用符で)は13,000を超えます。



電気は危険なものです。 どうやら、「葬儀の電圧電流」(引用符なし)のクエリで88万人のグーグルがこの証拠です。 「メモリ電圧」、「メモリ電力」、または「メモリ電流」(すべて引用符なし)を個別に見ると、結果は10万ほどのオフスケールです。 恐れて!



私たちは良い飲み物を持っています-フルーツドリンク。 しかし、この言葉は中性の形容詞にも使われています。 数百のグーグルには、「ブラックフルーツドリンク」、「ホワイトフルーツドリンク」、「レッドフルーツドリンク」、「バルトフルーツドリンク」があります。



アルメニア(現在トルコに属している部分)には、古代都市カルスがあります。 認識者はカレの街を出現させようとします。 クエリなしのクエリ「アルメニアの広場」には12,000のGoogleがかかります。



しかし、他の人がいないかのように、私たちはロシア人について何ですか? ここでは、ウクライナ語の隣人は「zo」という口実を持っています。 それほど普及していない-これはロシア語の「so」に類似しています(「交換可能な靴で学校に行く」を参照)。 多くの場合、「ZoRockiv」(2万人以上のGoogle)、「Zotisyach」(2.5万人のGoogle)、「Znodiv」(ほぼ8000-ここではすべての結果が引用符で囲まれています)などの表現でよく見られます。 (?)ウクライナのレコグナイザーは、ロシアよりも人気があることがわかります。 そして、それらは同様に美しく誤解されています。



認識機能は英語に影響を与えないと思いますか? いいえ、もちろん、これを疑うことはできません。 たとえば、ここには素晴らしい英語のpucがあります。 原則として、それはイタリック体で大文字で書かれており、写真の下には数字の後にドットで終わります。 ここでは、現象の規模を評価するのがより困難です。楽しんでください、google puc.1、puc.2など。 RuNetで。



純粋に英語のものも検索エンジンに反映されます。 「死ぬ部屋で」という表現には30万google以上の費用がかかりますが、ここでは多くの余分なものがここで扱われ、ドイツの記事もこのプロセスに介入しました。 発見されたものの中に素晴らしい「私は死ぬ部屋で死ぬライトを消します」を見つけました。 ちなみに、「ダイライト」自体には35,000のGoogleがかかります。



認識機能によって歪められた高貴な特定の記事は不快な動詞になり、通常のクリックがどのように見えたかを思い出すのは無作法です。 繰り返しますが、現象の規模を推定することは簡単ではありませんが、ポイントアンドディックリクエストの最初のページで、誤って認識されたクリックがあったことを修正することができます。 はい、紳士、解説者! 私はこのトピックについて下品なジョークをすべて表明していることを警告します.PR部門全体、3人の騎手、2頭の馬、1.5モスクワのタクシー隊を赤くすることを強制します-あなたのばかげたジョークは私の繰り返しにすぎません-あなたはそれを必要としますか?



英語の単語comer(文字通り、「来る人」、つまり訪問者)があります。 「コマーキック」というフレーズは、15,000を超えるグーグル(引用符内)を獲得しており、主にサッカーに関するテキストに見られます。



世界中のかなり少数の人々がアメリカ合衆国を好きではありません。 認識プログラムは、彼らの不満をサポートすることがあります-United Stalesクエリ(引用符で)は、23万以上のGoogleを収集します。 これが英語のインターネットミームにならなかったことは奇妙です。



英語では、私たちの研究はより困難です。 私は、実際には認識されていなかった外観、かつて食べられていた猫、さらには湖に連れて行かれた猫さえも、正確かつ大量にきれいな水にすることができませんでした。 試してみてください。



ウクライナの「zo」に似た現象により、ここではより単純であることが判明しました。 イオ-木星の衛星。「イオマイル」(1万4千以上のGoogle)、「イオポンド」(数千)、「イオステート」(4千)の組み合わせで出会った。



おそらく、この天文学では、認識言語の遠足を終了するでしょう。 良い金曜日を過ごして、あなたの注意をありがとう!



ドミトリー・デリャギン( 57DeD

技術開発局



All Articles