データの豪雨
今週のThe Economistから記事を訳出しました。
原文はこちらから読めます。
The Economist Feb 25th 2010
Technology
The data deluge
テクノロジー
データの豪雨
企業や政府、共同体は、その大きな可能性をようやく活用し始めようとしている
18ヵ月前、小売業者のための供給チェーン管理会社、リー&ファンは、ネットワークに毎日100ギガバイトの情報が流れていることに気づいた。今や、その総計は10倍に膨れあがっている。2009年中には、イラクとアフガニスタンの上空を飛ぶアメリカの無人飛行機が、およそ24年分に相当するビデオ映像を送って寄こした。今年配備される新しい機種は、先行機種の10倍ものデータストリーム(訳注:バイト単位の転送データ)を送ってくるだろうし、2011年には、それは30倍になるだろう。
どこを見渡してみても、世界の情報量は急激に増加している。ある見積りによると、2005年に人類は150エクサバイト(1,500億ギガバイト)のデータを生み出したという。今年、人類は1,200エクサバイト(12,000億ギガバイト)を生み出すという。この情報の豪雨は、ついて行くことすら、そして有益であるはずのその幾分かを保存しておくことすらとても難しい。ましてやそれを分析して、パターンを見つけ出し、有益な情報を引き出すのは、困難を極める。しかし、たとえ困難だとしても、そのデータの豪雨は、ビジネス、行政、科学、そして毎日の生活を、すでに変え始めている。消費者、企業、政府が、データの流れをいつ制限し、いつ促進するのか正しい選択をする限りにおいては、そこには大きな可能性がある。
ゴミの中からダイヤモンドを選り分けろ
一部の業界は、データを収集して活用することの能力でその道をリードしてきた。クレジット・カード会社はすべての購入を監視し、何十億もの決済を処理して見つけた法則によって、かなり正確に不正を特定できる。例えば、盗難されたクレジット・カードは、ワインよりも蒸留酒を購入するのに使われる傾向がある。何故なら、蒸留酒の方が売り払いやすいからだ。また保険会社は、疑わしい支払い要求を特定する手がかりを精査するのに秀でている。不正な支払い要求は、火曜より月曜にされることが多い。何故なら、事故をでっち上げる保険契約者は、偽りの証人として友人を週末に集める傾向があるからだ。こういった多くの法則を精査することによって、どのカードが盗まれたものか、どの支払い要求が偽りか、見分けることが可能になるのだ。
一方、例えば携帯電話会社の人間は、頻繁な通話の多くにライバルの回線が使われていないかどうか判断するため、契約者の通話パターンを分析する。もしもそのライバルの回線が、その契約者を離れさせる原因となるかもしれない魅力的なプロモーションを展開しているようであれば、彼、あるいは彼女に、思い留まらせる動機を与えることができるかもしれない。最近では、新しい業界のみならず古い業界も、同じくらい熱心にデータを解析している。小売業者は、オンラインのみならずオフラインでも、データ採掘(あるいは、昨今知られるところでは「ビジネス・インテリジェンス」)の達人だ。スーパーマーケットは、「バスケット・データ」を分析することにより、特定の客の嗜好に合わせてプロモーションを調整できる。石油業界は、鉱泉を掘る前にスーパーコンピュータを使い、地震データを収集する。そして天文学者は、望遠鏡を星に向けるだけでなく、クエリ・ツールのソフトウェアをデジタル天体観測で使用することが多い。
この技術をもっと発展させることは可能だ。長年の努力にも拘わらず、警察と諜報機関のデータベースはほとんど連携されていない。健康管理では、カルテのデジタル化が、健康状態の傾向を、特定し、監視し易くし、様々な治療の効果を評価し易くするだろう。しかし、健康状態の記録をコンピュータ管理化するための多大な努力は、行政的、技術的、倫理的な問題に阻まれることが多い。オンライン広告は、オフラインの広告に比べて、すでにかなり正確にターゲットを絞り込めているが、さらに個人に向けてターゲットを絞り込める見込みがある。そうすると広告主は、より高い広告費を喜んで支払うことになるだろう。このことは、続いて、オンライン広告を受け入れる準備が出来た消費者に、より豊かで広範な無料のオンライン・サービスが提供されるようになることを意味する。そして政府は、犯罪件数、地図、政府契約の詳細、あるいは公共サービスの実績の統計といった、より多くの情報を公共の場所に掲載するという考えに、ようやく辿り着いた。人々は、起業するためや、当選した役人の責任を追求するために、こういった情報を新しいやり方で再利用できる。このような新しい機会を握る企業、あるいは他社にそのツールを提供する企業は、繁栄することになるだろう。ビジネス・インテリジェンスは、ソフトウェア業界の急速に成長する部門のひとつなのだ。
そして、悪い知らせに備えて
しかし、データの豪雨には危険もある。データベースが盗難に遭うことにまつわる例を挙げてみよう。ディスクに一杯に詰まった社会保障のデータがなくなる。税金の記録が入ったラップトップをタクシーの中に置き忘れる。クレジット・カードの番号がオンラインの小売業者から盗まれる。その結果は、プライバシーの侵害、個人情報の流出、そして詐欺である。また、プライバシーの侵害は、このような不正行為なくしても起こりうる。フェイスブックやグーグルが、突然、オンラインのソーシャル・ネットワークのプライバシー設定を変更し、会員が図らずも個人情報を曝すことになる時に定期的に起こる騒ぎを見よ。様々な権威主義的独裁は、特に政府が企業に顧客の個人情報を渡すよう強いるような時、より不吉な脅威となる。人々は、自分の個人情報が保管され管理されているということよりもむしろ、その管理が疎かにされていることに気づくことの方が多い。
データの豪雨に伴うこういった欠点に対処する最善の方法は、矛盾するようだが、いくつかの領域でさらなる透明性を要求し、正しい方法でデータを入手し易くすることである。第一に、ユーザーは、他人に所有されている自分に関する情報に、それが誰と共有されているかということも含め、より十分にアクセスでき、コントロールできなくてはならない。グーグルはユーザーに、ユーザーについて何の情報を持っているか把握させている。そしてユーザーに、例えば、検索履歴を消去したり、あるいは、掲載広告の傾向を修正したりできるようにしている。第二に、世界のいくつかの地域ではすでにそうなっているように、各種組織は、組織の代表の情報セキュリティに対する意識を高めさせるためにも、セキュリティ侵害について情報開示を求められなくてはならない。第三に、組織は毎年セキュリティ監査を受け、(明らかになった問題の詳細までとは言わないまでも)結果のランクを公表する必要がある。これは、企業にセキュリティを最新の状態に維持するように促すことになるだろう。
そして、データをしっかりと管理する組織がしない組織より好まれるようになれば、市場のインセンティヴは機能するようになる。イノヴェイションの息の根を止めるややこしい規制を必要とせずとも、これら三つの領域のさらなる透明性が、セキュリティを向上させ、人々に、自分に関するデータをよりコントロールする力を与えるだろう。つまるところ、データの豪雨に対処することを学ぶ過程、そしてそれをどのように利用するのが最善かを考える過程は、まだ始まったばかりなのだ。