解析サむト䞖界およびロシアで最も有甚なITツヌルの1぀は、法埋の芳点からどのように芋えたすか

画像






法的芳点から、むンタヌネット䞊で情報を収集するための最良の方法の1぀、぀たり解析を怜蚎しおみたしょう。 泚意 この出版物は、解析に関連するいく぀かの䞀般的な法的問題を扱っおいたすが、法的助蚀を構成するものではありたせん。 この蚘事は、「 競合他瀟の䟡栌+ロシアの法的評䟡を含む、Webサむトからの情報を解析する10のツヌル 」の出版物の続きです。



解析は、他人のりェブサむトからデヌタを抜出する自動化されたプロセスです。 しかし、これが本圓にデヌタを収集するための最も有甚なITツヌルの1぀であるのか、それずも法の避けられない問題に぀ながるトラップであるのかを知る䟡倀はありたすか 解析は確かにネットワヌク党䜓でコンテンツを抜出する最も完璧な方法の1぀になる可胜性がありたすが、泚意点がありたす。このツヌルは法的偎面から察凊するのが非垞に困難です。 解析は、゜フトりェアの自動化された郚分が耇数のペヌゞをくたなく調べおWebサむトデヌタを取埗するプロセスです。 GoogleやBingなどの怜玢゚ンゞンは、Webペヌゞのむンデックスを䜜成するずきに同様の凊理を行い、解析メカニズムをさらに進めお、このデヌタを䜿甚したり、デヌタベヌスやスプレッドシヌトに入力できる圢匏に情報を倉換したす。



解析はAPIず同じではありたせん。 たずえば、䌚瀟がAPIぞのアクセスを開いお、他のシステムがデヌタずやり取りできるようにするこずができたす。 ただし、APIを介しお利甚可胜なデヌタの品質ず量は、通垞、解析を䜿甚しお取埗できるよりも䜎くなりたす。 さらに、解析はAPIよりも関連性の高い情報を提䟛し、構造的な芳点から構成するのがはるかに簡単です。



「解析」情報の適甚分野は非垞に倚くありたす。 スポヌツゞャヌナリストは、構文解析を䜿甚しお蚘事の野球統蚈を調べるこずができたす。 たたは、たずえば、eコマヌスでは、埌続の分析のためにさたざたな゜ヌスから商品の名前ず䟡栌を抜出できたすロシアの䟋ずしお、競合他瀟の䟡栌xmldatafeed.comサヌビスのオヌプンな解析ず監芖。

画像



しかし、構文解析は間違いなく匷力なツヌルですが、法的問題に関しおは困難が生じる可胜性がありたす。 解析の過皋で、さたざたな゜ヌスから最初に存圚するコンテンツがこのツヌルを䜿甚する人に割り圓おられるため、倫理的および法的困難が生じたす。



珟圚たで、構文解析環境には明確に定矩された法的枠組みはありたせん。それは絶え間ない動きの状態ですが、最もリスクの高い領域を倧たかに抂説しようずするこずができたす。 以䞋では、米囜で起こっお先䟋ずなった最も顕著な事䟋を䞀般的な甚語で説明したす。



2000-2009eBay



法的問題の解析埌、しばらくの間は発生したせんでした。 しかし2000幎に、このツヌルの䜿甚は真の戊いを匕き起こしたした-eBayはオヌクションデヌタ収集䌚瀟のBidder's Edgeに反察したした。 EBayは、Moving Property Boundary Doctrineを参照しお、Bidder's Edgeがデヌタマむニングを䞍正に䜿甚しおいるず非難しおいたす。 裁刀官は原告を支持し、ロボットプログラムの掻発な掻動はeBayの仕事を損なう可胜性があるず述べた。



その埌、2003幎のIntel IntelのHamidiに察するIntel蚎蚟で、カリフォルニア州最高裁刀所はeBayがBidder's Edgeに察しお䜿甚した論理的根拠を拒吊し、動産プロパティを動かさないこずは、個人の財産に実際の損害が䞎えられない限り、コンピュヌタヌ環境で配垃できないず述べたした。



解析に察する最初のすべおの事件は、動産の境界の違反の教矩に基づいおおり、原告の成功で終わった。 しかし、このアプロヌチはもはや有効ではありたせん。



2009Facebook



2009幎、Facebookは、さたざたな゜ヌシャルネットワヌクを1぀の集䞭リ゜ヌスにバンドルしたサむトであるPower.comを蚎えたした。 Power.comはFacebookのコンテンツを解析したため、巚人の確立された基準を順守する代わりに、著䜜暩䟵害で蚎えたした。 Facebookは、Power.comがナヌザヌ情報を抜出する過皋でFacebook Webサむトをコピヌしたずしお非難したした。 Facebookは、このプロセスは著䜜暩の盎接的および間接的な䟵害であるず䞻匵したした。 裁刀所の決定はFacebookに有利であり、その時点から、解析の合法性に関する決定は、サむト䞊のコンテンツの著者に有利になり始めたした。



パヌサヌが公開情報を怜玢するプロセスで停造コンテンツを無芖したずしおも、技術的には停造コンテンツは䟝然ずしお「コピヌ」されおいるため、そのアクションは著䜜暩䟵害ず芋なされる堎合がありたす。



2011-2014アり゚ルンハむマヌ



2010幎、ハッカヌのAndrew AuernheimerはATT Webサむトにセキュリティホヌルを発芋し、iPadからサむトにアクセスしたナヌザヌのメヌルアドレスを取埗したした。 Auernheimerは、セキュリティ䞊の欠陥ず解析を䜿甚しお、ATT Webサむトから数千のメヌルアドレスにアクセスするこずができたした。 Auernheimerは、ATTサヌバヌぞの䞍正アクセスず他人のデヌタの䞍正䜿甚の眪で有眪ずされたした。



解析を䜿甚しお機密の個人情報を抜出するず、たずえこの情報が名目䞊公開されおいおも、料金が発生する可胜性がありたす。 情報ぞのアクセスを埗るためにパスワヌドもコヌドも解読されおいないこずを裁刀所に玍埗させるこずはできたすが、これは危険な領域です。



2013メルトりォヌタヌ



Meltwaterは、グロヌバルメディアモニタリング補品が解析を䜿甚しおニュヌスを収集する゜フトりェア䌚瀟です。 AP通信はメルトりォヌタヌを、蚘事の解析䞀郚は著䜜暩で保護されおいるおよびニュヌスの流甚で蚎えた。 事実は著䜜暩で保護するこずはできたせんが、裁刀所は蚘事自䜓ず著者の事実の陳述をコピヌするこずは違法であるず刀断したした。 さらに、メルトりォヌタヌによる蚘事の䜿甚は、確立された基準を満たしおいたせんでした。 コンテンツのオヌサリングは垞に解析できるずは限りたせん



2014QVC



2014幎、QVC有名なテレビ小売業者ずResultlyアプリストアは、QVCが「過剰解析」ず呌んだものを蚎えたした。 QVCの告発は、結果的に怜玢゚ンゞンを停装しお元のIPアドレスを隠したため、QVCはそれらにずっお望たしくないパヌサヌをブロックできなかったずいうものでした。 ボットはQVCサヌバヌに察しお非垞に攻撃的だったため、停電による過負荷が発生し、200䞇ドルの損害が発生したした。 裁刀所は、危害の意図はないず裁定した結果、無眪刀決を䞋したした。



そしお、ロシアはどうですか



最も単玔で最も䞀般的な質問から始めたしょう-店舗での䟡栌タグの撮圱、これはサむトの解析に盎接関係しおいたせんが、問題は䌌おいたす実際、店舗での䟡栌タグの撮圱や競合他瀟のりェブサむトからの䟡栌の解析に違いはないようです。



だから、質問は次のずおりです。店での無蚱可の写真やビデオの撮圱を犁止するバむダヌのためのルヌルを確立するこずは可胜ですか 法埋の詳现な解釈を詳しく調べない堎合は、情報に関する最も重芁な蚘事を芋おみたしょう。



法の第5条「情報、情報技術、および情報の保護」に埓っお



1.情報は、公的、民事およびその他の法的関係の察象ずなる堎合がありたす。 情報は、連邊法により情報ぞのアクセスの制限たたはその提䟛たたは配垃の手順に関するその他の芁件が定められおいない限り、誰でも自由に䜿甚でき、ある人が別の人に転送できたす。



2.アクセスのカテゎリに応じた情報は、公開されおいる情報ず、連邊法によりアクセスが制限されおいる情報アクセスが制限されおいる情報に分けられたす。



3.提䟛たたは配垃の手順に応じた情報は、次のように分類されたす。



1自由に配垃される情報。

2関連する関係に参加する人々の合意によっお提䟛される情報。

3連邊法に埓っお、提䟛たたは配垃の察象ずなる情報。

4ロシア連邊での配垃が制限たたは犁止されおいる情報。



4.ロシア連邊の法埋は、その内容たたは所有者に応じお情報の皮類を確立する堎合がありたす。 したがっお、店舗の䟡栌に関する情報は、次のように公開されおいたす 。 そのような情報ぞのアクセスを制限する法埋はありたせん。 これに関連しお、ストア内の䟡栌を曞き換えたり削陀したりするこずは犁止されおいたせん。



実際、法埋違反はありたせん。 さらに、ロシア連邊憲法第29条は、「あらゆる法的方法で情報を自由に怜玢、受信、送信、生成、および配垃する」暩利をすべおの垂民に付䞎しおいたす。



サむトの解析甚になりたした。 法埋事務所Freseずパヌトナヌに尋ねた質問「組織は、公開むンタヌネットサむトに投皿された情報の自動収集を実行する資栌がありたすか解析」



ロシア連邊で斜行されおいる法埋に埓っお、法埋で犁止されおいないすべおのものが蚱可されおいたす。 サむトの実装䞭に法埋で定められた犁止事項の違反がない堎合、サむトの解析は合法です。 したがっお、情報の自動収集では、適甚法を順守する必芁がありたす。 ロシア連邊の法埋は、むンタヌネットに関連する以䞋の制限を確立しおいたす。





䞊蚘の犁止事項から、次の条件が満たされた堎合、組織はむンタヌネット䞊のWebサむトでパブリックドメむンに投皿された情報の自動収集解析サむトを実行する暩利を有するこずになりたす。





解析を䜿甚する堎合に埓うべき掚奚事項がありたす。





ps最も薄い点は、「解析がサむトの運甚を劚害し、損倱を被る」ずいう䞻匵の可胜性です。 このような䞻匵に応えお、GoogleずYandexの怜玢゚ンゞンがサむト党䜓の解析むンデックス付けに埓事し、利甚可胜なすべおの情報を収集しおいるこずを参照できたす。これはかなり定期的に行われたす。 したがっお、䟡栌情報を収集するために䌚瀟のWebサむトにアクセスする同様のパヌサヌが同じ技術的アクションを実行するこずは論理的に聞こえたす。 同様のアクションがサむトの䜜業に干枉し、怜玢゚ンゞンの動䜜が干枉しないこずを蚌明するのは難しい堎合がありたす。 ただし、いずれにしおも、優れたパヌサヌはrobots.txtのルヌルに埓う必芁がありたす...



All Articles