1.はじめに
ここ最近、「ビックデータ」という言葉がよく聞かれる。新しい情報技術に関しての用語ではあるが、現時点では共通で認識される明確な定義がない状況で、言葉だけが独り歩きしているようにも感じられる。しかし、IT関係技術の進歩により、数年前までは考えられなかったような大量のデータが容易に蓄積し分析できる環境が整ってきたことは事実であり、それらをうまく活用することにより、様々な成果をあげることができるのである。今回は、IT技術を利用して様々な情報を活用するヒントについて考えてみたい。
2.情報量の変化
少し前までのコンピュータシステムにおいて、そこで取り扱われるデータは、「顧客氏名」、「商品名」、「金額」、「個数」など、キーボードなどから直接入力された文字や数字のデータが大半であった。これらのデータであれば、多少規模が大きいシステムであっても扱うデータのサイズは、せいぜい数ギガバイト程度であり、データの検索や分析なども容易であった。
近年のIT関係技術進歩により、個人が使用するパソコンであっても、写真などの画像、音声や動画などを簡単に取り扱えるようになってきた。そのことが、保存するデータ量の増加につながり、ハードディスク等のデータ保存容量が数百ギガバイト以上のものが珍しくなくなってきた。
さらにインターネットの普及により、さまざまな情報が手軽に入手できる環境が整うだけでなく、ビデオカメラなどさまざまな機器のデジタル化が進み、映像や音声などもデジタルデータ化が容易になって、それらをパソコン等で扱うことにより、さらなる保存容量増大につながることとなる。
3.情報内容の変化
従来の「顧客氏名」、「商品名」、「金額」、「個数」などのデータは、容易に整理して構造化することができ、データベースに格納して手軽に検索などの処理を行うことができた。しかし、写真などの画像や音声などの情報については、コンピュータに保存することは簡単にできても、大量に保存されたそれらの中から、必要とされるものを簡単に検索して見つけ出すことは容易ではない。
たとえば、デジタルカメラで撮影した大量の写真をパソコンにそのまま保管した場合、自分の見たい写真を探すために、1枚ずつ順番に目で見て確かめていく必要がある。この検索を容易にするためには、検索に必要な情報をタグとして、撮影日、撮影場所、被写体の内容などを各写真に付加しておく必要がある。撮影するカメラの種類によるが、撮影日時や場所、撮影した条件などを自動的にタグとして設定してくれるものもあるが、カメラの機械が自動的に認識することが難しい被写体の内容などを付加する場合は、人間が判別して情報を付加する必要がある。
画像や音声などをはじめとする、我々が日常的に目にするものの大半は、このような非構造化データであり、これらをコンピュータ上で扱うためには、それに応じた対応が必要となるのである。
4.様々な情報の活用
非構造化データを扱うためには、いろいろと難しい点があるのであるが、それらをうまく扱うことにより、日常身の周りにある事象などを分析することができ、そこから新たなものを見出せる可能性がある。
近年、カーナビゲーションシステムが搭載されている自動車が増えてきている。
そのカーナビゲーションシステムの一部機種においては、自動車の位置情報を記録し、それを携帯電話などのネットワークを通じてセンターのコンピュータに送信し、その付近の情報をセンターから受け取って、自動車に設置されている画面に表示できるものがある。このしくみを活用して、たくさんの自動車から送信された位置情報を蓄積し、分析することによって新たな別の情報として利用した事例がある。
各地に大きな被害を出した東日本大震災は、各地で道路網にも甚大な被害を与えた。この道路網の被害状況を調べる方法として、ナビゲーションシステムより送信された位置情報について震災発生時以降のものについて解析し、それぞれの道路についいて自動車が走行した履歴があるかを分析し、走行した履歴があれば、その道路は通行可能であると判断し、その情報を公開して必要物資の輸送などに活用された。
本来は、各車に付近の情報を知らせるために送信されたデータを、大量に収集してマクロ的に分析することにより、道路網の被害状況といった、別の情報として活用することができたという、興味深い事例である。
5.まとめ
技術の進歩により、さまざまな情報を電子データ化し蓄積するということが容易になってきた。だが、構造化されていないさまざまな情報が蓄積されることにより、それらを整理して分析するためには、これまでとは違う様々な視点やそれを解析する技術が必要となってくる。しかし、これらの情報をうまく活用することができれば、いままで見えてこなかった新たな何かが見えてくる可能性があるのである。
皆さんの身の周りに普段からあって、蓄積されずに右から左へと流れていっているだけの情報についても、一度集めて整理してみてはいかがでしょうか? もしかすると何か新しい別のものが見えてくるかもれません。
———————————————————————
■執筆者プロフィール
池内 正晴 (Masaharu Ikeuchi)
学校法人聖パウロ学園
光泉中学・高等学校
ITコーディネータ