パンチカードを使用するための教育プログラム(または1890年から1970年までの「ビッグデータ」の処理方法のストーリー)

期間1890-1970では、ビッグデータのすべての処理はパンチカードを介して実行されました。 パンチされたカードは、いわゆる 「記録装置」。その中心的なリンクは、電気機械式の「パンチカードソーター」でした。 パンチカードと関連機器は、国勢調査、経理、在庫、給与などのさまざまなタスクを解決するために使用されました。







人々はパンチカードをどのように使いましたか? 電気機械パンチカードソーターはどのアルゴリズムに従いましたか? 数値データフィールドによるソートはどのように実行されましたか? そして、文字列で? このすべてについて-以下。















人々はパンチカードをどのように使いましたか?





電気機械パンチカードソーターの動作原理





ビット単位のソートアルゴリズム



パンチカードソーターはどのように仕事をするのですか? エレガントな「ビット単位のソート」アルゴリズムを実装しています。 一番下の行:パンチカードソーターは、一度に1桁のデータフィールドを処理します。 3桁のフィールドでソートするには、パンチカードのパックをソーターに3回渡す必要があります。 したがって、アルゴリズム:







  1. オペレーター、ソーターによって指定された数値データフィールドに従ってパンチカードを並べ替えると、最初の実行時に、このフィールドの最下位ビットのみが処理されます。 そして、このカテゴリの価値に応じて、現在のパンチカードをどこにドロップするかを決定します。10個のデジタルポケットのうちのどれ(0から9)。
  2. 選別機がポケットにパンチカードを配布し終えたら、オペレーターはそれらを取り出し、共通の束に入れます。 順番:ゼロポケットから9番目まで。
  3. オペレーターは、組み立てられたパンチカードのパックをソーターに入れ、カテゴリごとに手順1と2を順番に繰り返します。
  4. すべて、今パンチカードがソートされます。




ビット単位のソートアルゴリズムの利点





文字列データのエンコード方法





文字列ソートアルゴリズム



このエンコーディングのおかげで、ソーターは文字列データフィールドをアルファベット順にソートできます。 これを行うには、2回の実行が必要です。 アルゴリズムは次のとおりです。







  1. 最初の実行では、パンチカードソーターは数値データフィールドをソートするときとほぼ同じ方法でカードを整理します。 違いは、アルファベット順のソートには1〜9の9つのポケットしか含まれていないことです。
  2. 並べ替えが完了すると、オペレーターはパンチされたカードをデジタルポケットから取り出します。 再び、順序(数値データフィールドによる順序付けの場合):最初のポケットから始まり、9番目で終了します。 オペレーターは、収集されたカードのパックを2回目のソートのために送信します。
  3. 2回目の実行では、パンチカードソーターは「ゾーン」の行(0、11、および12)のみを読み取り、数字のある行を無視します。
  4. 結果として、注文されたパンチカードは、ソーターによって3つの「ゾーン」ポケットに分配されます。AからIまでは、12番目のポケットに配置されます。 JからR-11日。 SからZまで-0番目。
  5. ソートを最初の1文字ではなく、たとえば最初に2つまたは3つ実行する必要がある場合、上記のプロセス(ステップ1〜4)が各文字に対して順次実行されます。 つまり キャラクターごとに、パンチカードソーターを2回実行します。








そのため、コンピューターがまだない場合、企業はパンチカードを使用してビッグデータを処理していました。 パンチカードは取り返しのつかないほど時代遅れであるという事実にもかかわらず、80文字の行を使用してテキストの書式設定を我慢しなければならないときはいつでも、コンピュータテクノロジーの現在の状態に影響を及ぼしています。 たとえば、Far Managerで作業しているときに、似たようなことが観察されます。








All Articles