翻訳者への注意:ABBYY Lingvoおよびその他のツールの作業を高速化

今日、電子辞書は、ブラウザ、デジタル化された参考書、 通信データベース (後者は主にノンフィクションテキストの翻訳者にのみ重要です)とともに、翻訳者の主要なツールの1つになっています



電子辞書の中で、ABBYY Lingvoは1つの重要な機能であるインデックス付きフルテキスト検索で区別されます。 Adobe Acrobatのインデックスを使用して同様の機能を実装できますが、語彙領域のインターフェイスの利便性は比較できません。



ABBYY Lingvoは長い間、通常の辞書からユニバーサルソースアグリゲーターに進化してきました。 クリエイターの巨匠の作品に加えて、愛好家は基本的なバイリンガル辞書、ケンブリッジ、コリンズ、ロングマン、メリアム-ウェブスター、オックスフォードシリーズ、ブリタニカのような百科事典の多ボリューム説明辞書を含む何百ものマニュアルをLingvo形式でデジタル化しました。 ネットワーク巨人のローカルコピー(ウィキペディア、ウィクショナリー、都市辞書など)が作成されました。 そして、通常の使用では、これは例外的な機会を提供します。 しかし、全文検索では、このすべての富が言語コーパスと通信の基盤に変わります。 複雑な用語、安定したフレーズ、フレーズ単位の翻訳におけるこのような検索の価値は、過大評価するのが困難です。



各リリースで、ABBYYはコンパイルされた辞書と検索インデックスの境界を拡大します。 すでに2ギガバイトのソーステキストの辞書をコンパイルできます。 ただし、多数の辞書を接続すると、インデックスが増加します。 ディスク上の辞書自体と検索ユーザーインデックスの両方がギガバイトサイズに達することもあります。 この場合、全文検索の速度が低下し、ハードドライブの速度が影響し始めます。 SSD開発の時代は、この問題の解決に役立ちますが、これまでのところ、これらのメカニズムは、価格が高く耐摩耗性が低いため、まだ一般的に使用されていません。 幸いなことに、速度の向上という点でSSDよりもさらに高速な方法があります。



プログラムに辞書自体を移動させ、インデックスをディスクからメモリに検索できます。 むしろ、私たち自身がそれらをそこに移動し、プログラムはそれらがまだハードドライブ上にあるかのように引き続き動作します。 この古い実績のあるツールであるRAMディスクで役立ちます。



メモリに一種のディスクを作成するプログラムが多数あります。 他のニーズにはアクセスできないメモリの使用を許可するものには、特に注意を払う必要があります。



最新の32ビット非サーバーWindowsには、メモリ使用量の2つの主な境界があります。 最大4ギガバイトのソフトウェア制限であり 、デバイスのメモリ割り当ての 3つの機能に切り捨てられます 。 これらの理由から、どれだけのメモリを入れても、メインユーザーのWindowsには3ギガバイト以上のプラス/マイナスが表示されません。



ただし、これらの制限には、 PAEとメモリの再マッピング(メモリホール、 PCIホール )という独自の回避策があります。 したがって、64ビットまたは非サーバーシステムがなく、同時に必要なすべてのRAMディスクを配置するのに十分な3ギガバイトのメモリがない場合、これらすべてをオンにしてメモリを増やす必要があります。 BIOSを自分で確認する方が良いです。たとえば、 この便利な記事では、特定のデバイスが説明された回避策のサポートを拒否されていますが、古い運命のマザーボードのBIOSに「メモリホール」オプションが見つかりました。



記載されたすべての操作の前に、重要なデータをアーカイブし、何か問題が発生した場合に回復するためにシステムの最新のイメージを作成すると便利です。



現在までに、システムに見えないすべてのメモリを使用できるようにする2つの有名なプログラムがあります: Primo Ramdisk(VSuite Ramdisk II)SuperSpeed RamDisk Plusです。 誰かが3ギガバイトで管理することを計画しているなら、非常に高速な(そして、いくつかのデータによると- ここここ -最も速い) RAMDisk Enterpriseに注意を払うことができます。 これらすべてのプログラムを使用すると、コンピューターの電源を切る前にRAMディスクの内容をハードドライブのイメージにダンプしたり、システムブートの非常に早い段階でメモリにイメージを復元したりできます。 これはダウンロード自体の速度を低下させますが、将来の利益は起動時にわずかな遅延の価値があります。



過去6〜7年のほとんどのデスクトップおよびラップトップ用マザーボードでは、最大8ギガバイトのメモリをインストールできます。 現在、これはすでに非常に安価な喜びであり、このサイズは、Lingvoの最も豊富な辞書セットでも十分なはずです。 ただし、極端な場合には、より小さなサイズで実行できます。



RAMディスク上のLingvoに移動できるものは何ですか?



1.最も単純なのは、ユーザーとシステムの両方の辞書です。 翻訳者はユーザー辞書自体を接続し、どこにでも配置できます。 Windows XPのシステム辞書は、c:\ Documents and Settings \ All Users \ Application Data \ ABBYY \ Lingvo \ version_number \ Dic \ Systemフォルダにあります。



辞書の両方のグループは、予約のために元の場所に残しておくことができ、プログラムは辞書構成ファイルを使用してコピーフォルダーを指すことができます。 ユーザー辞書の場合、これは%USERPROFILE%\ Local Settings \ Application Data \ ABBYY \ Lingvo \ version_number \ Dic \ dictconf.iniファイル、システム辞書の場合はc:\ Documents and Settings \ All Users \ Application Data \ ABBYY \ Lingvo \ version_number \ Dic \ dictconf.ini。 両方のファイルで、オートコレクトを使用して古いアドレスを新しいアドレスに置き換える必要があります。その前に、両方のiniファイルのバックアップコピーを保持することを忘れないでください。 この方法が不便と思われる場合は、次の方法を使用できます。



当然、この段落と次の段落で提案されているすべての操作は、プログラムを閉じてメモリからアンロードした後に実行する必要があります(Lingvoは作業を完了するのに時間がかかる場合があります。プロセスのアクティビティを表示するプログラムで確認することをお勧めします)。



2.プログラム自体とバイナリライブラリ(c:\ Program Files \ ABBYY Lingvo version_number)でフォルダーを移動できます。 おそらくこれは速度の印象的な向上をもたらさないでしょうが、何かが勝つことができます。 さらに、このフォルダーには多数の.amdファイルと.ammファイルも含まれており、これらがモルフォロジーの原因です。 プログラム自体がそれらをメモリに完全にロードせず、必要に応じてディスクから繰り返しロードする場合、移動することは理にかなっています。



3.そして最後に-辞書索引。 システム辞書の場合、これはフォルダーc:\ Documents and Settings \ All Users \ Application Data \ ABBYY \ Lingvo \ version_number \ Index、ユーザー辞書用-%USERPROFILE%\ Local Settings \ Application Data \ ABBYY \ Lingvo \ version_number \ NonAbbyyIndex(ただし、親フォルダ全体を転送します。システムディクショナリの場合は、親フォルダ内のインデックスとともに、非常に重くなりますがめったに必要とされないサウンドがあるため、これを行わない方がよいでしょう。



ここでもう1つ難題を指摘する必要があります。 構成ファイルを編集することで辞書の移動をサポートできる場合、インデックスとプログラム自体の移動は扱いにくいものです。 しかし、ここで1つのツールが役立ちます。残念なことに、NTFSファイルシステムでのみ動作します(残念ながら、RAMディスク自体もFAT-32システムに存在できます。高速であり、障害時の信頼性とフォールトトレランスはそれほど重要ではありません)。 この機能はNTFSジャンクションポイントです。 Primo Ramdisk(VSuite Ramdisk II)にはそれらを作成するための組み込みユーティリティがありますが、 Junctionユーティリティを使用することもできます(Windows Vista以降では、mklinkコマンドを使用できます)。 アルゴリズムは非常に簡単です:フォルダーをRAMディスクにコピーします(必要に応じて名前を変更できます)。予約のために、元のフォルダーの名前を「original_name_bak」などに変更し、コピーの元の名前で元の親フォルダーにジャンクションポイントを作成します。 すべてが透過的に動作し、プログラムは元のファイルを使用した以前の作業とコピーへの新しいリダイレクトとの間に違いを生じません。



結論として、辞書を追加してインデックスを更新するとき、RAMディスクを管理するシステムがシステムがクラッシュした場合にコンテンツをイメージにダンプすることができない場合、メモリ内のフォルダーの内容を同期し、ディスク上のオリジナルをバックアップする必要があることに注意する必要があります。 そうすれば、いつでもバックアップから回復できます。



本格的な動きにより、プログラムは開始および終了し、単語リストを単語入力フィールドと同期し、言語を切り替え、単語を検索し、カードを開きますが、特に目立っています-何倍も高速-見出しの全文検索とマスク検索が高速化されています。



***



RAMディスクの使用は、辞書をデジタル化する人にも採用する必要があります。 場合によっては、ギガバイトサイズのテキストファイルを操作する必要があります。 そして、このような巨大なソースを操作するためのテキストエディターがありますが、検索、手動編集、および自動置換操作(DSLマークアップの作成に使用されるすべての時間)は非常に遅いです。 ソースをメモリに配置し、それを使用した編集作業が加速されると、コンパイルも高速になります。



これらのスキルはすべて、他のプログラムに適用できます。 翻訳者は辞書と同じくらい頻繁にブラウザを使用するようになったため、ブラウザのキャッシュだけでなく、データベースを使用してブラウザプロファイルをメモリに移動することを検討する価値があります。 幸いなことに、これについては、Habréだけでも多くの記事があります。



All Articles