「Sberbankのオープンデータ」がオープンデータではない理由と、それをどうするべきかについて

画像

数日前、重要なイベントが発生しました。ロシアの大手企業の1つは、オープンデータをWebサイトに公開することを発表しました。 この会社は、SberbankおよびWebサイトの対応するセクションです。 このセクションのオープニングは彼らのウェブサイトでプレスリリースを授与され、数十の金融および非金融メディアが重要なイベントとしてそれについて書いた。







Sberbankは本当に素晴らしいことを成し遂げましたか? これは普通の出来事であり、Sberbankが今やデータをオープンしたことは何ですか? これはさらに議論されるものです。







はじめに



Sberbankを続行する前に、オープンデータという用語に戻りましょう。







法の最初の公式定義112-(これらは8-の修正です)







所有者がインターネット上に再利用する目的で事前に変更することなく自動処理できる形式で投稿した情報は、公開データの形式で公開されている公開情報です。







ウィキペディアの 2番目の定義

オープンデータとは、特定のデータが著作権、特許、その他の制御メカニズムに制限されることなく、機械可読な使用とさらなる公開のために自由にアクセス可能でなければならないという考えを反映した概念です。 Creative Commonsライセンスなどの無料ライセンスを使用すると、著作権の制限からデータを解放できます。 データセットがパブリックドメインにない場合、または無料の再利用権を付与するライセンスに接続されていない場合、そのようなデータセットは、インターネット上で機械可読形式で投稿された場​​合でも、オープンとは見なされません。







Open Data Charterの3番目

オープンデータは、誰でも、いつでも、どこでも自由に使用、再利用、再配布するために必要な技術的および法的特性を備えたデジタルデータです。

または混chaとしたロシア語:







オープンデータは、誰でも、いつでも、どこでも自由に使用、再利用、共有しなければならない技術的および法的特性を備えた一般公開されたデジタルデータです







また、オープンデータは、公開データの憲章に正確に反映された公開の原則を明確に策定しています。

これらの原則:







  1. デフォルトの開放性
  2. タイムリーかつ完全
  3. アクセスしやすく便利
  4. 比較可能で統合可能
  5. ガバナンスと市民の関与を改善する
  6. 開発と革新のために


私が個人的にロシアのオープンデータの話題に取り組んでいるこれらの7年間、私は彼らがオープンデータと呼ばれていないことを非常に多く聞いたのを見ました。 最も顕著な愚かな質問は、「自由にアクセス可能な機械読み取り可能なデータ」の説明を通じて定義が与えられたとき、「機械読み取り可能なデータは機械で読み取れるデータですか?」という質問でした。







しかし、すべての定義において、一つのことを覚えておくことは重要です- オープンデータは技術的に資格のある消費者に焦点を合わせています 。 州はそれ自体が新しい情報製品を生産するのではなく、新興企業、IT企業、社会活動家がこれを行うことを可能にします。







オープンデータを公開する理由



この特定のケースを理解するには、データ所有者がなぜそれらを公開するのかを知ることが重要ですか? 特に企業や政府機関-時にはこれは完全に奇妙に見えるかもしれません。







PR。 コミットメントまたはメリット







これらは、誰もがデータを公開する3つの主な理由です(ファンと虚栄心の質問、意図的に括弧を省略します)。







また、オープンデータで組織の活動を確認し、実際にオープン性と透明性の問題を確認する場合は、次の3つの理由のいずれかで答えを探してください。







PR



たとえば、オープンデータに基づいたPRの方法。 その主な特徴的な能力は、大衆消費者 、大衆投票者、大衆市民を対象としています。







技術とデータの問題は脇にあります。 出席の問題、メディアの報道、言及のある記事の数-最初に行きます。







生きている例としては、 モスクワのオープンデータポータルがあります 。市当局は、意味のない28行のデータセットがあったとしても、出版物に関するニュースを広めています。







負債



法律では公開が義務付けられているため、公開データが公開されるのは義務または強制です。 データの所有者は常にオープン性に関心があるとは限りませんが、法律の要件を順守して公開しています。







たとえば、中央銀行は銀行から報告フォームを収集し、サイトの特別なセクションで開示します -これは銀行と中央銀行の法的義務です。







別の例は、上記の112-と8-です。 当局は、基本データセットを開示し、法律の前に責任を負う非履行に対する義務として正確に公開する必要があります。







コミットメントは、オープン性の基盤です。 このため、データを公開する必要がある人の多くは、データを利用可能にするために追加の手順を実行しません。 彼らは必須の要件のみに準拠していますが、この広告プレスリリースについては書きません。







たとえば、モスクワ政府が28の軍事貿易の住所を含むデータセットを公開し、ニュースサイトに配信する場合、たとえば、市役所の収入報告書を公開データとして公開し、メディアを通じて配信することも事実ではありません。







言い換えれば、義務は可能な限り静かに、いつの間にか実行されます。







便益



なぜ自分のデータを公開することで利益が得られるのでしょうか? それは思える-所有し、沈黙している、他の誰かが知る必要はありません。







しかし、オープンデータが政府および商業団体によって公開される理由があります。 たとえば、Kaggleの [ データセット]セクションは、数千人のデータサイエンティストを必要とする新しい発見、ソリューション、洞察を求めて埋まっています。







または、連邦財務省が長年にわたってFTPサーバーを介して政府調達ポータルからデータを配信している理由(オープンデータのあるストーリーの前でさえ)-連邦の主題の数百の取引相手が必要とするデータベースを配布する方が簡単で安価だからです。







一部の企業はハッカソンを開催し、従業員を探しています。 Googleが透明性レポートで行っているように、オープンソースコミュニティの評判データを公開している企業もあります。







それで、ズベルバンクとは何ですか?



Sberbankのオープンデータセクションをもう一度見ると、次の機能があります。







無料ライセンスなし



使用と配布の自由の代わりに、免責事項があります。







提供される情報は、2016年第4四半期のSberbank PJSCのデータの分析結果です。 データは、管理、会計、財務諸表ではありません。 指定された情報へのリンクを使用する場合、Sberbank PJSCへの参照が必要です。 広告ではありません。







これは無料ライセンスと密接な関係はありません。







データセットなし



データをダウンロードするには、チャート上の特別なボタンを見つける必要があります。メニューには、XLSX、CSV、またはJSONのアップロードセクションがあります。 特徴は、これらのダウンロードはすべてJavascriptファイルからのクライアント側のダウンロードであるということです。







実際、すべてのデータは、 http: //www.rdatascience.ru/opendata/data1.jsからhttp://www.rdatascience.ru/opendata/data13.jsの 13個のJavascriptファイルに保存されます。







また、CSVなどへのアップロードは、Javascriptコードを使用して行われます。 また、データセットを直接出力することはできません。 これらのアナリストとの共同作業ではなく、視覚化に重点が置かれています。







セットの説明がありません



このサイトでは、州のポータル上のデータセットの実際のパスポートで積極的に使用されている「パスポートデータセット」という用語を使用しているにもかかわらず、もちろんそのようなものはありません。 責任者に関する情報も、セットの構造の説明もありません-何もありません







サービスの販売とビッグデータとの混合



このセクションは、Sberbankの研究の売却と、これがすべてビッグデータで行われるという事実で終わります。 また、フィード形式自体は、オープンデータセクションというよりも、ある種の情報ビジネスのロングライドに似ています。







結論



これらすべてから、結論は1つしか導き出せません。このセクションのSberbankの目標はPRのみであり、それ以上のことではありませんでした。 いつか、Sberbankがオープンデータで作業する形を見つけて、彼らとコミュニティの両方に利益をもたらすことを願っています。 なぜなら、人気のある用語を使用して商用サービスを宣伝しようとすることに似ているからです








All Articles