アルファベット...トピックに関する考察...個人的なもので完了します。

1.アルファベット。 連想接続。



アルファベットについて多くのことが言われているので、最初にカール・ビューラーの「言語理論」を引用します。

「アルファベットは連想連鎖(機械的シーケンス)であり、それ以上のものではありません。 しかし、誰もが彼を学び、知っています。 したがって、オブジェクトのシーケンスをアルファベットにマッピングすると便利な相関関係になります。 私たちは、合理化のために常に実際にそれを使用しています。 自然言語を構成する標識のシステムには、多くの連想連鎖と織り合わせがあり、それらは心理学的な観点からアルファベット順と同じレベルにあり、私たちの知識を合理化する包括的なタスクで同じサービスを提供することを証明することは難しくありません他の人へのこの知識のオブジェクトとメッセージについて。」



そのため、アルファベットの各要素を値に合わせて配置する必要があり(実際に現在実行されています)、この質問を閉じます。 ただし、すべてがそれほど単純ではありません。 アソシエーションのセットAのアルファベットを考慮することは論理的です。iがjとaiおよびajに等しくない場合:Aの場合、AIはAJ = emptyになります。

記号セットS(Symbolクラスのオブジェクト)から言語l:L(Lは言語セット)のアルファベットへのマッピングTは、Tlで示されます。 それらは、関連のソースの一種です(リレーションTlを介して)。 Tlの符号のマッピングによって生成される関連セットは、Al(言語l自体のアルファベット)で示されます。 セットA1は有限であり、番号を付けることができます。これはアソシエーションまたはアルファベットのコードになりますが、記号のコードと呼ぶのは明確に間違っています。 言語lの符号sによって生成される関連付けは、Tl(s)で示されます。 Tl(s):Al。 複数のキャラクターが同じ関連付けを引き起こす可能性があります。 たとえば、大文字の記号「A」と小さな「a」は同じ関連付けを生じさせます。 したがって、Tl(s1)とTl(s2)が交差するようにs1:Sおよびs2:Sが存在する可能性があります。 これが1つのポイントです。 2番目のポイントは、この関連付けが環境に依存すること、または各言語ごとに独自の関連付けのセットがあることです。 つまり 英語、フランス語、ロシア語の環境では、同じ記号が異なる関連付けを引き起こす可能性があります。 通常、マッピングTlを実装するには、関連付けテーブル(リレーションTlでもあります)を構築すれば十分ですが、たとえば、楽譜、地図作成、電気回路の構築など、より複雑なアルゴリズムを使用することもできます。



2.文字をグループ化します。



ただし、すべてのカテゴリの標識について、独自の関連付けテーブルを作成する必要はありません。 すべての言語に共通する関連性を呼び起こす兆候があります。 真の、さらに強力なステートメントが真です。異なる言語の異なる関連付けは、通常文字と呼ばれるオブジェクトのみを呼び出します。 このプロパティを強調するには、それらをレターグループに結合します。 そして、グループへの分割はすでに行われているため、多くの兆候をいくつかのグループに分けます。

グループは数字(デジタルグループ)であり、0、1、2、3、4、5、6、7、8、および9の記号が含まれており、現代のすべての言語で明確かつ同一の関連性が生じます。

すべての制御文字と書式設定文字を含む制御文字グループ(コマンドグループ)。 現代の標準では、このグループのアソシエーションが使用されますが、管理するアソシエーションに直接表示される標識は提供されません。 いくつかの奇妙な論理により、このグループのT文字のマッピングはありません。また、グラフィック表示では、空の関連付けを使用する文字が使用されます。 つまり 改行の関連付け(KOI8標準のコード10)に直接表示される文字はなく、改行を表す文字はKOI8標準のコード182の「文字関連付け」に表示されます。

マークグループには、角かっこ、引用符、カンマなどが含まれます。 この文字グループの基本的な違いは、字句解析に参加せず、独立したトークンであるということです。 つまり 一連の文字に参加することでトークンを形成するのではなく、独自の存在に参加します-解析に直接不在です。

文字グループには、別の機能があります。これは、このグループの文字の主な目的です。これらの文字のシーケンスは、トークンと呼ばれる独自の関連付けを形成します。 トークンは、他のグループの記号によって互いに分離されています。その記号の1つはスペースです。

キャラクターをグループに分割した後、それらの関連付けを対応するグループに適宜分割できます。 任意のiおよびj:L、s:文字の場合、Ti(s)= Tj(s)= Asであることに注意してください。 この事実により、これらのグループの兆候により、すべての言語に対して単一の関連テーブルが作成されます。 また、これに加えて、Letter以外のすべてのグループでは、「register」プロパティ(大、小)は意味がありません。



3.データ入力。



上記のすべてのグループは、物議を醸す1つの品質によって結合されており、それらはすべてキーボードから入力できます。 これを行うために、彼らはキーボードを発明し、文字エンコーディングとキーボードレイアウトの両方の標準を発明しました。 ここでは、関連付けではなく、キーボードから入力される記号であることを強調します。 そして、キーボードコードとアソシエーションコードを一致させようとすると、物事の実際の状態に対する頑固な抵抗に直面します。 しかし、もちろん、実際に必要なすべての兆候の導入を想定することは不可能です。 したがって、キーボードの機能を拡張する必要があります。 キーボードの目的は、押されたキーと記号を直接対応させることですが、そうすることは常にキーボードのサイズを不合理に大きくすることを意味します。 したがって、キーを組み合わせる方法(複数のキーを同時に押す)を使用すると、文字のコントロールグループにとって便利です。 そして、疑問が生じます。すでに標準になっている機能(コピー、削除など)の文字標準を拡張し、編集するために新しい文字(新しいセクション、メモなど)を追加するときではないでしょうか。 本当だと思う。 そして、このために、それぞれについてグラフィックイメージを作成します(多くの場合、既に考えられています)。 特殊なシーケンスを使用して、文字の組み合わせが引き続き可能です。 いわゆる構図。 この手法は、絵文字(コロンと括弧のシーケンス)またはsign®などに広く使用されています。 合成文字の文字を入力するためのアプリケーションは、カスタム文字と絵文字に十分な機会を提供します。

環境に応じて、文字とキーボードキーの対応を変更することをお勧めします。 キー上の文字のイメージを変更できるLebedevキーボードは、私たちの原則とよく一致しています。




All Articles