異なる著者の平均単語長

今まで誰も「なぜ自転車を発明したのか」と言っていませんでした。そして、トマトはこの自転車に飛び込みませんでした。ロシア語の単語の平均の長さは長い間計算されて5.28文字に達しました。 ここにソースへリンクがあります 。 そして、このトピックは私に次のことを書かせました。 私の以前の投稿について話し合ったとき、 シュテッツェンエイリエーターのhabrayusersは、異なる著者の平均語長はプレゼンテーションスタイルによって異なることを示唆し、解剖学的な違いがあるかもしれません、私は知りません。 ところで、Googleで最も求められているものの平均長を推測してみてください。 一般的に、私はこれが本当にそうであるかどうかを確認することにしました。



以下はプログラムのソースであり、テキスト内の単語の総数と平均単語長を考慮しています。 プログラムはperlで書かれています。



use strict;

use locale;

use POSIX qw (locale_h);

setlocale(LC_CTYPE, 'ru_RU.CP1251');

setlocale(LC_ALL, 'ru_RU.CP1251');

open (TEXT, "<text.txt");

undef $/;

my $text = <TEXT>;

close(TEXT);

my @words = $text =~ m/[-]+/ig;

open(OUT, ">out.txt");

my ($count, $sum);

foreach(@words){

$count++;

$sum += length($_);

}

print OUT " : $count\n : ".($sum/$count);

close(OUT);









私が使用したほとんどすべてのテキストはモシュコフ図書館から取られました。 それは私が得たものです。



画像



結論は、著者ごとに平均単語長がどれだけ異なるかは自分で調整します。



All Articles