メタデータデータ:技術図面のインデックス作成の問題

画像 翻訳者から設計およびエンジニアリング文書の電子アーカイブを作成する問題に関する一連の記事を続けます。 今日の記事では、スキャンした図面のインデックス作成の問題について説明します。 この場合、インデックス付け(属性)は、分析とメタデータシステムへのその後の入力として理解され、それに基づいてアーカイブ内のドキュメントの分類、構造化、および検索が実行されます。 この問題に関する実践的な経験を議論し、交換するために読者を招待します。





大きなフォーマットのドキュメントをインデックス化する簡単な方法はありません。 多くの場合、大量の画像をスキャンしてインデックスを作成するプロジェクトを外部委託する組織について耳にします。 残念ながら、これらの組織は多くの場合、インデックス付きデータの仕様の定義、標準化、検証に十分な注意を払っていません。 その結果、デジタル化後、多数のエラーが検出されます。 これらのエラーを回避する方法に関するいくつかの推奨事項を以下に示します。



考慮すべき最初のポイントは次のとおりです。ほとんどの場合、スキャンおよびインデックス作成者は、スキャンされたドキュメントの意味を理解せず、理解することはほとんどできません。 彼らはスキャンの品質を保証できますが、ドキュメントの検索を整理して保証する仕事は、主に顧客の責任です。



大きなフォーマットの図面のインデックス作成作業は自動化できません。 そのような自動化のためのプログラムはなく、表示されることはありません。

図面の名前は、下部と右側または左側の両方に配置できます。 テキストは、図面のさまざまな部分に配置できます。 さらに、多数の日付が図面に添付される場合があります。 描画フォントまたは手書きラベルを認識しても、多くの場合、期待した結果が得られません。 図面には複数の開発者を含めることができます。どちらを選択する必要がありますか? この場合に可能な唯一の解決策は、すべての図面を慎重に確認し、情報を分析して、システムに手動で入力することです。



コンピューターに座る前に、データ入力の標準と略語を理解する必要があります。 データベース内のすべてのクエリは、情報の変換ではなくパラメーターに基づいています。 使用されているすべての略語のリストを作成し、プロジェクトに関与しているスタッフの注意を喚起します。 データ入力標準は必須ではなく助言であることに注意してください。



データ入力の標準と略語を決定したら、使用する句読点にも注意を払う必要があります。 句読点の使用を完全に放棄することをお勧めします-もちろん、それらに重要な意味の負荷がかかる場合を除きます(たとえば、ハイフンとピリオドが図面の数を意味の部分に分けているため、使用を拒否することはできません)。



最後に、インデックス作成プロセスを常に監視する必要があります。 次のような絶え間ない質問に備えてください:「ここに何を書くの?」など インデックス作成はチームワークです。 また、共同の努力により、図面のメタデータを正しくフォーマットし、ドキュメントを操作するプロセスを非常に便利にすることができます。 それ以外の場合、なぜドキュメントをデジタル化するのですか?



All Articles