このようなデジタル化の革新の中で、データフロー制御の一般的な傾向を背景に、 「オープンデータ」の現象が現れました 。 さらに効果的な実用化のために、すべての長所と短所を理解するために、個別に扱う価値があります。
今日、州と企業の両方からのデジタルデータの自由で自由な開示の成長プロセスに気付かないことはもはや不可能です。 コミュニティが形成される)、 サミットが開催される)、 コンテストが組織され、 ポータルが作成されます。 それでも、私はこの経済関係のデジタル化の分野の意味と、それが正しいアプローチでもたらす利益を理解し、理解したいと思っています。
注意してください。 このドキュメントでは、デジタルデータの無料配布と無料配布の経済的および管理的な意味に重点を置いています。 オープンデータの社会的および政治的役割は否定されず、もちろん、別の出版物に値する。
本書で言及されているデジタルデータは、構造化され、関連する、統合された情報単位であることに同意します。 非構造化テキストやアナログテキストとは異なり、検討中のデータは、個々の重要な単位、それらの関係、およびグループのレベルで処理および分析できるため、提示された主題領域の枠組み内の仮説を含む特定の二次的な結果(結論および結論)を取得できます。 このような直接または深い処理の可能性に基づいて、データは特別な経済的意味を持つ強力な情報リソースを表現します。
人が自分の活動について収集したデータは、特定の事実、イベント、オブジェクトの状態、およびそのような活動のその後の評価のためのプロセスと、予想される確率的結果を得るために将来実行する必要があるアクションの選択を記録します。 情報技術の開発、蓄積されたデータアレイのサイズ、処理を自動化する機能により、デジタルデータが実際のビジネスファクターになり、多くの問題の解決策を見つけることができます。州または社会。
あらゆる種類の無形のリソースと同様に、デジタルデータには、マテリアルとマテリアルを根本的に区別する興味深い機能が1つあります。
私たちは皆、それについて完全に知っており、どこでもそれを使用しています。 それは、実際には存在せず、物理的な意味でのみメディアにアタッチされているデータは、元のボリュームと品質を失うことなく無限に複製できるという事実にあります。
データは、そのような「永遠の」リソースであると同時に「無限の」リソースです。 さらに、同じデータからいくつかの有用な結果を同時に取得できます。 さらに、無制限の人々のサークル間で1組のデータを配布することは可能ですが、同時に、マテリアルリソースを複製して自然なコピーを望む人に配布することは物理的に不可能です。
デジタル情報のこの驚くべき能力を修正したので、現在開発されているオープンデータの伝統的な概念に目を向けます。
「オープンデータ」のいくつかの定義を次に示します。
「 オープンデータハンドブック 」から:
「オープンデータは、誰でも自由に使用および配布できる情報です。 データのソースを示し、元の条件と同じ条件下で配布するために必要なのは、要件のみです。
オープン性の完全な定義は、これが何を意味するかを詳細に明らかにします。 最も重要なものを選びます:
1.アクセシビリティと読みやすさ:データは、それらを複製するための合理的なコストを超えない範囲で利用可能でなければなりません。 できればインターネット経由で。 データ形式は読みやすく、変更しやすいものでなければなりません。
2.再利用と普及:データは、他のデータセットとの組み合わせを含め、再利用と普及を許可する条件で提供される必要があります。
3.普遍的な参加:誰もがデータを使用および配布できる必要があります。 アプリケーション、人、またはグループに対する差別があってはなりません。 たとえば、「非営利目的の使用のみ」という制限は、「営利目的の」使用を禁止しています。また、アプリケーションの可能な領域の制限(例えば、教育のみ)は受け入れられません。
「 オープンデータ憲章 」からの翻訳:
「オープンデータとは、誰でも、誰でも、いつでも、どこでも無料で使用、再利用、配布するために技術的および法的に利用可能になったデジタルデータです。」
そして、Svanbankのオープンデータ「なぜについて」のIvan Begtinの出版物からのオープンデータのいくつかの原則は、「オープンデータではなく、それをどうするべきか」です。
「また、オープンデータは、公開データの原則を明確に明示しており、オープンデータ憲章に正確に反映されています。
これらの原則:
-デフォルトで開く
-タイムリーかつ完全
-アクセシブルで便利
-比較可能で統合可能
-管理と市民の関与を改善する
「開発と革新のため。」
すぐに、「オープンデータ」の概念は、制限なしで直接利用できることを明確に表していることに注意してください。 この意味でのデジタル経済にとって最も重要なことは、そのようなデータの価値は「 無料 」であることです。 ちなみに、この「無料」はいくぶんis意的であり、オープンデータを絶対に無料で使用しないことを意味しますが、受信者に課金することなく(ロイヤルティなしを含む)大量のデータが配信されることを示しています。 もちろん、その後のデータ処理には一定のコストがかかり、既製のセットを公開すると理解可能な直接コストが発生します。
それにもかかわらず、完全なデジタル化の時代に、「情報が世界を支配する」と一部の情報のコストが天文学的な数字に達することができる理由について詳しく見てみましょう。機会だけでなく、無料で配信されるデータの必要性もあります。
確かに、重要なデータの配列を発見することのポイントは、時には直接または隠された商業的可能性で、人々の広いサークルに。 そのようなデータの消費者は普通のネットワークユーザーではなく、中小企業でもないことを忘れないでください。 これらのカテゴリは、その専門的および物質的な能力のため、また緊急のニーズとタスクのために、さまざまな主題分野からのオープンデジタルデータの強力なストリームを認識することができません。
いわゆる「開かれた政府」の枠組みの中で国が発見したデータに関して言えば
膨大な数の一般市民が利用できる「フラットな」デジタルデータセットには、スプレッドシートの理解、視覚化、統計分析、信頼性評価などの能力や関心が密接に含まれていないため、実用的な意味はありません。 たとえば、社会的に重要なデータをXML形式でアップロードするだけで、国体と市民社会の立場を何らかの形で「まとめる」ことはできますか? 通常の納税者にとって、特定の会計年度の州予算の支出に関するデジタルデータを公開することは有用でしょうか?また、彼はどのように効率的かつどこから税金を徴収するのかを把握できますか?
そうではないようです。
そうではないようです。
オープンデータを使用し、それを特定の消費者サークルにとって有用なものに変えることができるサードサードまたはサードサードが必要です。 そして、データへの無料アクセスを公開する対象は、この「3番目」が仲介者であり、データの使用から追加の利益を潜在的に引き出すことができることをよく知っています。
しかし、パブリックドメインでデータを公開する人の関心は何ですか?
これらすべての結果が、自分自身のためになる他の人の外観になりそうな場合、なぜ特別な努力をし、専門家を引き付け、リソースを割り当て、システムを稼働状態に維持するのか。
データの複製と第三者への配布には、大幅な制限費用はかかりません。 しかし、相対的自由度は主要な経済的障壁を取り除くだけですが、それは動機ではありません。 出版社の動機は、一見すると思われるよりもやや深く、データ発見プロセスに関心を持つ一部の参加者が示したいものとは多少異なります。 それを理解するためには、デジタルデータの掛け算を掛ける驚くべき能力に加えて、州とビジネスに積極的に「開かれた」動機を与える別の要因を考慮する必要があります。
既存の(蓄積された)履歴データに基づいて新しい知識を検索する
普遍的な情報化とグローバルネットワークの深い浸透により、さまざまな組織構造や一部の個人でさえも「過剰な」量のデータを作成して蓄積できるという事実に至りました。 「情報兵器」の競争は、完全に異なる目的と形式の保存された「数字」の量の複数の増加を刺激します。 さらに、データ所有者はデジタルストレージから最大限のメリットを引き出すことができません。理由は次のとおりです。
- 第一に、ストレージは、異種の弱いまたはファジー関連のデータで本当に混雑しています。
- 第二に、1つのデータセットに基づいて、無限の数の結果を得ることができ、優先順位の選択はここではまったく明らかではありません。
- 第三に、データの組み合わせは何度でも可能であり、他の外部データと関連しています。
- 第4に、データに基づいて特定のカテゴリの結果を取得するには、データ所有者が利用できない可能性のある特別なコンピテンシー、ハードウェア、またはソフトウェアを使用する必要があります。
- 第5に、データの重要な自己評価は難しく、その監査には専門家の差別化された関与が必要です。
- 第6に、異なる動機が、データを操作する新しい方法と方法、データを集約および結合するための新しいオプションを示唆する場合があります。
データを生成して保存するサブジェクトは、貴重なリソースが他のユーザーから閉じられ、メディアに静かに休み、適切なメリットをもたらさず、関連性を低下させることでその価値を徐々に失うことを理解しています 。 同時に、彼は、 彼自身のリソース、専門的かつ創造的な制限のために、データから最大の有用な効果を受け取らず、受け取ることができないことをよく知っています 。代替選択の冷酷な経済理論の法律によって巧みに設定されています。 つまり、大量のデータを処理する場合、分析と使用のために有限数のソリューションを選択する必要があります。
ほとんどのオプションは、デジタル情報の独占所有権の一部として実現することはできません。
さらに、閉じたデータセットのフレームワークでは、デジタル情報を結合するほぼ無限の可能性を実現することはできません。
公開されたデータにアクセスしたサードパーティは、所有者によって使用されていない、または使用されていないソリューションに代替を適用する権利を有し、同じデータに基づいて非常に有用な結果を取得します。
オープンデータの消費者は、特定のデータセットと対象分野内で、新しい効果的なソリューションと技術を促すことさえできます。 ここから、公然と無料でデータを公開するという疑問が生じます。 その無限の応用において無限の人間のニーズに匹敵する唯一の経済的資源を使用しない方法。
クローズドモードでは、データを最大限に活用するにはデータが多すぎます。
最良の効果は、突然の1回限りの独創的なソリューションだけでなく、さまざまな選択肢を整理することによっても実現できます。 また、以前と同様に、さまざまなセットやデータセットの組み合わせの処理と分析の成功と品質を予測することは非常に困難です。 複雑で構造化されたデジタルデータが多いほど、時間と情報技術(機械資源)だけでなく、より多くの創造的で専門的なコスト(対象分野)が必要になります。
フリーモードでデータを公開するための実際の最も重要な動機は、新しいソリューション、新しい方法、モデル、および技術を検索する必要がある、つまり指定された分野の新しい知識であると結論付けます。
付随するオープンデータを実際に確認するものは、多数のハッカソンやコンテストです。 そして、これは絶対に正しく理解しやすいものです。フィードバックとの共同努力によってのみ、履歴データセットを「復活」させ、それらに基づいて本当に重要な結果を得ることができます。
もちろん、個人や従業員ごとに異なる動機があり、データを開示したり、何らかの形でこのプロセスに参加したりすることを奨励しています。
内部管理を掘り下げると、二次的な動機もあることがすぐに明らかになり、時には経営上の変化に悪影響を及ぼします。
オープンデータも例外ではありません。
組織のリーダーシップのレベルでの完全に明白で意図的なイニシアチブは、検閲の専門家でさえ状況を説明するには不十分であるため、実行者によって「発明的に」サポートされる可能性があります しかし、これはすでに完全に異なる会話や研究のトピックです。
オープンデータも例外ではありません。
組織のリーダーシップのレベルでの完全に明白で意図的なイニシアチブは、検閲の専門家でさえ状況を説明するには不十分であるため、実行者によって「発明的に」サポートされる可能性があります しかし、これはすでに完全に異なる会話や研究のトピックです。
無料のデータプロバイダーの利他主義について誤解を招く印象があるかもしれません。 これは絶対に当てはまりません。 いずれにせよ、これはそうではありません。 オープンで無料のデータの公開は、出版社にとってそれ自体が目的ではありません。 このプロセスでの彼の主な機会と責任は、興味深い有用な新しいソリューションを得るためのフィードバックの確立と、彼が公開したデータで作成された能力です。
まとめると。
正しい、すなわち 真のメリットをもたらすため、データを公開する動機は、新しい知識とソリューションをベースに検索することにあります。
したがって、そのようなデータの使用に料金を設定したり、配布を制限したりする意味はありません。 また、個々の専門家と専門家のコミュニティまたはビジネスの両方が公開データの操作に関与し、重要なフィードバックを受信することは理にかなっています。
無料データの現象は、その外観によるものです。
- 過剰なデータ-生成および保存されたデータの量が、一部のエンティティの処理と分析の能力を超えました。
- データを無料で複製する機能-デジタルデータの特徴は、自由に繰り返しコピーして各ユーザーに転送できることです。
- 知識の検索の無限の可変性-データ処理オプションの多様性により、制限された資格やその他の要件を導入することなく、分析や新しい知識の検索のために幅広い人々を引き付ける必要が生じます。
- データの真の価値を評価する複雑さ-特定のデータに基づいて真に「魔法の」結果が得られるまで(つまり、真に価値のある商業的に重要な知識が生成されるまで)、データに課金する価格と誰が支払うかは明確ではありません。
- データ破損のリスクはありません-データに関する誤った決定または非効率的なモデルを受け取った場合でも、これは初期データに影響を与えず(誤用の結果として失われたり壊れたりすることはできません)、さらに、第三者によって得られた否定的な結果は評判に影響しませんパブリッシャー。
州および商業上の秘密に関する重要な注意事項
考慮される動機と「無料」要因により、データのすべてではなく一部の分布に関する主な経済的制約が取り除かれます。 自由な開示の技術と慣行以外に、明らかに競争上重要なデータが残っており、そのデータの普及はセキュリティを脅かし、所有者の外部(あらゆる)リスクを増大させます。 無制限の人数のオープンモードでのデータの公開は、商業または国家の秘密の分野の話ではありません。 ある意味では、オープンデータは、データを「商業」(「州」)秘密として分類するための基準を批判的に再考する絶好の機会です。 , (-), « » .
公的に公開されたデータは、大容量(ビッグデータ)を含む通常のトランザクションデータと同じ機能を主に備えています。また、サブジェクト分析で使用する独自の問題と機能があり、個別に処理する必要があります。
そのようなトピックを「オープンデータ」と見なす場合、州によって開かれたデータの観点だけでなく、より広範囲に見て評価する必要があります。ビジネスはデータの自由な開示に関心がありますが、独自のタスクと関心を持っています。同時に、デジタルの世界では、各参加者が個人情報と個人データを提供する必要があります。そして、このすべての公開された情報を1つの「ヒープ」に混ぜてはいけません-単純な理由の1つとして、これらのタイプのデータはそれぞれ異なる方法で管理されます。
, , ...