ビッグデヌタダむアログ

こんにちは



-健康。 お元気ですか 生きおいる



-しがみ぀いおいたす。 陜気で明るいずさえ蚀えたす。 さお、泚文したすか あなたの珟圚の奜みは䜕ですか-焌きドラドたたはビヌフフィンガヌミット



-知りたせん。 むしろ、2番目。 そしお、IT゜リュヌションを販売する前の状況はどうですか 倉庫に「鉄」を持ち蟌めたすか たたは、赀字がすでに圢成されおおり、片手で2぀以䞋を䞎える必芁がありたすか



-実際に。 すぐに2シフトで仕事をしたす-朝に売り、倕方に発送したす笑。 Big Systems 2013フォヌラムはOpen Systemsによっおホストされおいたしたか







-いいえ、蚪問に倱敗したした。 誰もがビッグデヌタを䜿い始めたら、今埌10幎間で私たちを埅っおいる明るい未来に぀いお䜕か興味深いものがありたしたか



-残念ながら、私もそうではありたせんでした。 そしお、ビッグデヌタに関するそのような懐疑論の理由は䜕ですか



-たず、マヌケティングのベヌルの背埌にある穀物を芋るこずが困難になっおいるずいう事実から、そこからビッグデヌタが成長しお本圓に有甚なものに発展するはずです。 IT関連の雑誌やブログのすべおの号で、ビッグデヌタに関する蚘事やメモに出䌚うこずは間違いありたせん。この蚘事では、ビッグデヌタずはたったく関係がないか、たたは間接的に関係しおいるこずに぀いお話すこずができたす。



-そしお、ビッグデヌタは本圓に新しいずいう考えを蚱したせんし、ITの革新的な方向性を蚀うこずを恐れおいたせんか



-ビッグデヌタの構成芁玠を敎理しお、「倧きなストロヌク」で衚瀺しおみたしょう。 たず、デヌタの曞き蟌みず読み取りのメカニズムを含むデヌタストレヌゞ゜フトりェアです。぀たり、CRUDゞェネレヌタヌず、メタデヌタを保存しお、曞き蟌たれた内容ず堎所を把握したす。 ハヌドりェアからこの゜フトりェアに必芁なのは、凊理胜力ずメモリのみです。 さらに、メモリはRAMの圢でもハヌドディスクの圢でもかたいたせん。 60幎代以降、プロセッサずメモリの動䜜の基本原則が倉わったず思いたすか



-いいえ、原則は同じたたですが、メモリのパワヌず量は桁違いに増加したした。 したがっお、誰もがビッグデヌタの時代が来たず蚀いたす-テラバむト単䜍のデヌタ量は軜薄ず芋なされたす。



-そうです。 垂堎に出回っおいる高速か぀倧容量のハヌドドラむブは、最初のコンピュヌタヌが登堎したずきでも動䜜原理が定められおいたため、革新的ずは蚀えたせん。 もちろん、技術的な郚分は近代化されおいたす-技術的なプロセスが削枛され、新しいむンタヌフェヌスが登堎しおいたす。 プロセッサヌに぀いおも同じこずが蚀えたす。プロセッサヌはより小さく、より高速になりたすが、「革新的」ではありたせん。 ぀たり、ビッグデヌタに䜿甚されるすべおのハヌドりェアは、本質的に同じ叀い良奜なディスクずプロセッサですが、珟圚では、芁求の厳しいフラッシュディスクずマルチコアを備えたバヌゞョンがありたす。



-゜フトりェアはどうですか



-これは、ほんの少しのむノベヌションがある堎所です-同じHadoop、たたはむしろその半分-HDFS。 分散ファむルシステムの圢匏でデヌタストレヌゞを提䟛し、それにアクセスを敎理したす。 以前は、これは実際には起こりたせんでしたが、ここのTeradataの担圓者はあなたず議論するこずができたす。 Hadoopの出珟により、数癟テラバむトの情報を保存し、そこから情報を取埗するこずさえ可胜になりたした-ずころで、これは2番目でした。



-どういう意味



-デヌタを保存しお読み取るだけでは十分ではありたせん。必芁なものをデヌタから抜出する必芁もありたす。 次に、Hadoopの埌半MapReduceがポップアップしたす。これは、HDFSから必芁なデヌタを抜出しお凊理するために必芁なものです。 ここにはむノベヌションの欠劂がありたす-スヌパヌコンピュヌタヌで䞊列蚈算が登堎し、この考えは新しいものではありたせん。 Doug Cuttingは新しいものを思い぀きたせんでしたが、分散コンピュヌティングのフレヌムワヌクを開発したした。 超䞊列アヌキテクチャを芋るず、Teradataは80幎代に再び登堎したした。 したがっお、芁玄するず、ビッグデヌタにはほずんど革新がありたせん。



-なぜ今圌女に぀いお話したのですか



-珟代の「鉄」の技術的特城により、数癟テラを保存および凊理するこずが可胜になりたした-以前は想像するこずさえ困難でした。 安䟡なドラむブずマルチコアプロセッサ。



-そしお、すべお、ビッグデヌタはHadoopで構成されおいたすか



-倚くの人が自分もビッグデヌタだず蚀いたす-すべおの䞻芁ベンダヌは、゜リュヌションがビッグデヌタず連携し、倧量のデヌタを凊理するように蚭蚈されおいるず蚀っおいたす。 Oracle、EMC、HP、IBM、Teradataなど。 しかし、抂しお、ビッグデヌタは、Cloudera、Hortonworks、たたはMapRであっおも、Hadoopです。 コンセンサスはありたせんが、Exadata、Greenplum、Netezza、Paracel、Vertica、Teradataなどの゜リュヌションはビッグデヌタの分野に垰属したす。



-どんな理由で



-数十テラバむトたたは数癟テラバむトの比范的倧量のデヌタを適切な時間で凊理できたす。



-すべおのマヌケティングは䜕に関連しおいたすか ベンダヌはHadoopのアむデアに觊発され、それに぀いおみんなに䌝えようずしおいたすか



-もちろんありたせん。 たずえば、EMCはGreenplumを、HPはVerticaを、IBMはNetezzaを、SAPはSybaseを賌入したした。これらすべおの費甚は倚額であり、これらのコストを回収しお利益を䞊げる必芁がありたす。 したがっお、すべおのベンダヌは䌚議を開催し、雑誌に蚘事を曞き、䌝道者を雇いたす。これらはすべお、ビッグデヌタの時代が到来し、賌入の時が来たこずを朜圚的な顧客に玍埗させるマヌケティング蚈画の䞀郚です。 なぜこれが必芁なのか、顧客は自分で考え出さなければならない、垂堎には既補の゜リュヌションはありたせん。



-そしおビッグアナリティクス ビッグデヌタを䜿甚しお倧量の情報を分析したすか



-そしお、それは小さなものずどう違いたすか この分析に䜿甚されるすべおの数孊的および統蚈的方法は、長い間発明され蚘述されおきたした。この分野では根本的に新しいものは䜕も珟れたせん。 20䞖玀に開発された数孊的装眮が䜿甚されたため、珟圚では䜿甚されおいたす。 情報量が膚倧な割合に達したずいう事実から、分析方法は倉わっおいたせん。 この倧きな分析を芋せおください...



-うヌん...デヌタサむ゚ンスに぀いお䜕か聞いたこずがありたすか



-もちろん。 呚りの人がデヌタサむ゚ンスに぀いお話しおいるずき、それに぀いお知るこずは難しいこずではありたせん。 たずえば、モデルData-> Information-> Knowledge-> Wisdomを䜿甚したデヌタ分析プロセスを想像しおみたしょう。 ぀たり、最初にデヌタを取埗したす。この堎合は、単なるバむトシヌケンスです。 このバむトシヌケンスに隠されおいる倀は情報であり、メタデヌタを䜿甚しお取埗したす。たずえば、名前はこの列に栌玍され、誕生日はその列にありたす。 次のレベルである知識に進むために、数孊的および統蚈的な方法を情報に適甚し、そこから知識を抜出したす。たずえば、ロシアでは60歳以䞊の人の数を調べるこずができたす。 この事実は、珟圚たたは過去の状況に察する掞察を䞎えおくれたす。 この情報を操䜜しお、将来䜿甚するこずができたす。 しかし、さらに先に進むために、次のレベル-知恵、すでに他の方法-ニュヌラルおよびセマンティックネットワヌク、機械孊習、ファゞヌロゞック、぀たり人工知胜に関連するすべおの方法を䜿甚しおいたす。 知恵は珟圚の状況の完党な理解を䞎えおくれたす。぀たり、「ロシアに60歳以䞊の人がいるのはなぜですか」ずいう質問に答えるこずができたす。 予枬や目論芋曞も䜜成できたす。 デヌタサむ゚ンスは、さたざたな分野の方法ずアプロヌチの組み合わせです-ここでは機械孊習、ここではデヌタマむニング、ここでは人工知胜、通垞の数孊、゚キスパヌトシステム、遺䌝的アルゎリズムなどであり、取埗するためにデヌタを凊理する方法を理解したすそのうちの知恵です。 実際、非垞に興味深いこずです。これは最近発生し、その道の始たりにありたす。 この分野の最新の動向を興味を持っおフォロヌしおいたす。



-そしお、デヌタサむ゚ンスで根本的に新しいものが登堎したしたか



-ただです。 自分自身をデヌタサむ゚ンティストず呌ぶ人々は、長い間人類に知られおいるセットからさたざたな方法を適甚しお結果を調べようずしおいたす。 かなり面癜いものが出おくるこずもありたす。 ずころで、むンフォグラフィックが返される理由の1぀は、倧量のデヌタを凊理し、特定の領域のいく぀かの事実ず珟象をカラヌチャヌトずグラフの圢で衚瀺できるようになったこずです。 これにおける特定のメリットは、デヌタサむ゚ンスに属したす。 たた、この方向の開発の速床がかなり速いこずに泚意したかったです。 テキストおよびグラフィック情報、ビデオおよびオヌディオの凊理には䞀定の成功がありたす。 テキストに含たれるセマンティックロヌドの認識、知的怜玢、音声認識-これらはすべお、機械孊習ずデヌタサむ゚ンスの接点になりたした。 同じアルファドッグがすでに森の䞭を走っおいお、すべおの朚に匵り付くわけではありたせん。



なぜデヌタサむ゚ンスが今すぐ人気になったのですか



-再び、技術的な胜力が珟れたした。 珟圚、すべおの家庭には70幎代の暙準によるスヌパヌコンピュヌタヌがありたす。 スマヌトフォンの8぀のコアは、もはや誰にも驚きたせん。 孊生でさえ、数十テラバむトのディスクを賌入する䜙裕がありたす。



-たあ、デヌタサむ゚ンスでそれは明らかです。 それでも、ビッグデヌタを䞭心に䜜成されたマヌケティングの誇倧広告を脇に眮くために、それは実甚的なものがありたすか



-もちろん。 毎日生成されるデヌタの量は膚倧です。 珟圚、電球にもIPアドレス、より正確にはMACがあり、必芁に応じおそこからいく぀かのむンゞケヌタヌを取埗できたす。 自宅でもビッグデヌタを手配できたす-照明の必芁なむンゞケヌタヌを300ルクスに蚭定し、倖郚センサヌから倪陜の照明の倀を取埗し、照明が垞に300ルクスになるように電球の電力を調敎したす。 同時に、消費電流の枬定を行いたす。このような枬定倀を1幎䞭に蓄積するず、翌幎に必芁な電気の量ず、ラむトがフルパワヌで点灯したずきずたったく䜿甚しなかったずきを把握できたす。 矎しいむンフォグラフィックを描くこずだけが残っおいたす-それだけです、あなたはビッグデヌタにいたす笑。 実際、ビッグデヌタの䞻な商甚アプリケヌションは珟圚、公益事業、䞍動産垂堎、茞送および物流、倉庫、薬、政府、金融、保険で芋られおいたす。 これらの領域では、生成されたデヌタのフロヌは非垞に倧きく、自分の目的に䜿甚するこずができたす。 科孊的な目的や調査のために、どこでもビッグデヌタを䜿甚できたす。制限はありたせん。 しかし、ここでの難点は、ビッグデヌタ甚の完党で完党な商甚゜リュヌションが存圚しないこずです。それを自分で考え出すのはあなた次第です。 この点で最も先進的なのは、TheSmarterCityおよびSmarterPlanetプロゞェクトを備えたIBMです。これらはもちろん匷力なものです。



-もちろん゚キサむティングに聞こえたすが、実際に動䜜するプロゞェクトは既にありたすか 䞀般的に、ロシアのビッグデヌタず同様に



-ご存知のように、すべおの倧手ベンダヌがここにハヌドりェアを持ち蟌み、それらに぀いお話しおいたす-Oracle Big Data Appliance、EMC Greenplum HD、EMC Greenplum MR、IBM BigInsights、Teradata AsterData。



-そしお、圌らず䞀緒に仕事をする方法をすでに知っおいる人々は䜕ですか ゞャビストはデヌタ分析を理解しおいたすか



-はい、でも倧したこずはありたせん。 ちなみに、ビッグデヌタを操䜜するために、Javaを知る必芁はありたせん。 同じCloudera Impalaはすでにベヌタ版ずしおリリヌスされおいるため、すぐに通垞のSQLを䜿甚しおビッグデヌタをリアルタむムで䜿甚できるようになりたす。 Rはただ研究する必芁がありたすが...



-そしお、これらの人々の倚くは



-より倚くの人がビッグデヌタの分野で働いおいるず蚀いたすが、それが䜕であるかを本圓に理解しおいたせん。 本圓に知識のある人々は指で数えるこずができたす-私はロシアでここを意味したす。



-これを玹介するのは誰ですか むンテグレヌタヌはビッグデヌタを知っおいたすか



-䌁業が独自にビッグデヌタを実装しおいる限り。 しかし、驚くべきこずに、むンテグレヌタヌも目を芚たし、その䞀郚はこの方向に郚門を開蚭し、人々も登堎したした。 IBS、Nvision、Technoserv、FORS。 あなたは笑いたすが、アむテコでもビッグデヌタのトレンドが始たりたした。 これたでのずころ、圌らはマスコミで有名な実装やプロゞェクトに぀いお曞いおいたせんが、物事はゆっくりず進んでいたす。 同じSberbankがRDセンタヌにビッグデヌタラむンを開蚭し、そこで䜕かを研究しおいたす。 数幎以内に、圌らは自分の目的のためにビッグデヌタを䜿甚する可胜性がありたす。



All Articles