ビッグデータの活用が競争に勝つ鍵に

0
1357

今年に入って明らかに「ビッグデータ」に関するニュースや話題が増えた。ただし、ビッグデータについて明確な定義はまだ確立されていないようだ。一般的には、従来の並列データベース管理システム(DBMS)では扱うのが難しいペタバイト級以上の非定型のデータで、かつリアルタイム性の高いものを指すことが多い。この条件だと、リアルタイム性はあるものの定型データであるPOSなどのトランザクションデータや、非定型データではあるもののリアルタイム性のない音声や動画などのマルチメディアアーカイブなどはビッグデータに当てはまらないことになるが、これらの大容量データもビッグデータの一形態とされることが多いようだ。
ビッグデータの例としては、WebサーバのログやSNSに投稿されたテキストデータなどがあげられる。SNSに投稿されるテキストデータや、その時に取得される位置情報などのサーバログといえば、まさにライフログである。ビッグデータという新しいキーワードに、従来のライフログがすっぽり取り込まれた形になったといえるだろう。

ビッグデータの活用は、すでに様々なビジネスで実用化されている。たとえば、Google翻訳では辞書データベースを搭載する代わりに、膨大な文書の原文と翻訳文のデータを瞬時にマイニングすることで、精度の高い翻訳を実現している。また、行動履歴データを蓄積したライフログの解析は、ECサイトにおける商品のレコメンデーションやオーディエンスターゲティングによるインターネット広告の配信などにも応用されている。

ビッグデータをインターネット関連ビジネスに応用するのために重要な点は、ほぼリアルタイムで分析ができるということだ。いくら大量のライフログを蓄積したところで、そのビッグデータの分析に時間がかかってしまうようでは、今訪問してくれているWebサイトでのアクションには活用できない。インターネットの業界でビッグデータが注目されているのは、リアルタイムの分析手法が確立されてきたことで、ライフログを蓄積する価値が高まったということに他ならない。ビッグデータの分析は、アメリカでは「ビッグマス(big mathematics)」と呼ばれているが、日本でもビッグデータ分析をビジネスチャンスと捉える企業が増えている。

野村総合研究所は、ソーシャルメディアでやりとりされるテキスト情報や携帯電話・スマートフォンのGPS機能によって生成される位置情報など、ビッグデータの活用について2016年度までの進展を予測した「ITロードマップ」を2011年5月に公表した。その中で、ビッグデータの活用こそ、企業の競争力向上や社会問題の解決につながるとして、その積極的な活用を提言している。