普段何気なく使っているインターネットの検索エンジンも、使い方次第で情報検索の精度に大きな違いが出てきます。今回は、インターネットや有料の商用データベースを上手に使いこなす基本を整理しておこうと思います。知らなくても使えるけれど、知っていると必要な情報を探す際の時間や作業の無駄を大幅に削減して、効率よく情報を取り出すことができます。
例題として、次の調査テーマを設定してみましょう。
機械業界における東南アジアでの現地生産や企業買収に関する記事等を探し出したい、ただしフィリピンについては必要ない、と言うものです。
この場合の手順は、先ず「現地生産」や「企業買収」に関する情報を探します。
次に、その中から「機械」業界に関する情報だけに絞り、更に「東南アジア」の地域に属するものだけに絞り、最後に「フィリピン」に付いての情報を振るい落とせば良いわけです。この作業を演算と言っていますが、数学のように難しいものではなく、使うのは足し算(OR演算)、掛け算(AND演算)、そして引き算(NOT演算)の3種類しかありません。この手順を式に表すと、以下のようになります。
(現地生産 OR 企業買収) AND 機械 AND 東南アジア NOT フィリピン
商用の記事情報データベースでは、このような検索式をキーワード欄に記入することもありますが、GoogleやYahoo等インターネットの検索エンジンでは、もっと簡便に使えるようになっています。これらの検索エンジンでは、「検索オプション」とか「検索設定」の文字列をクリックすると上のような演算ができる頁が開きます。そこでは、足し算(OR演算)は「いずれかの語を含む」、掛け算(AND演算)は「全ての語を含む」、引き算(NOT演算)は「含めない」と表現されています。ぜひ、この詳細検索のできる頁を開いて利用してみてください。
また、演算の順序は、通常、足し算→掛け算→引き算の順に行うのが定石でもあります。つまり、必要そうな情報を足し算で広く集めておき、次に必要なものだけに掛け算で絞込み、最後に不要なものを引き算で振い落すのが良いのです。これらの演算を一気に行う場合の優先順位は、一般に引き算が最優先され、次いで掛け算、最後が足し算の順になりますので、注意してください。
演算では、留意すべきことが一つあります。引き算は、むやみに使わない方が良いと言うことです。上の例では、「フィリピン」の他に「マレーシア」や「シンガポール」についての情報を同一の記事・頁内に記述しているケースがあり、引き算をすると、この情報は失われてしまうことになるからです。
ところで、この手順で演算すれば、上の例題テーマに対する解は的確に得られるのでしょうか?
残念ながら、現在の技術レベルでは、的確な解に混じって「ノイズ」と言っているゴミ情報が紛れ込んでいます。このノイズは絞込み(掛け算)をする際に発生します。つまり、一つの完結した記事・情報の中に、指定した複数のキーワードの全てが現れていれば、それで掛け算(AND演算=重複集合)が成立したことにしているのです。ここに問題があって、実際は掛け算が成立しないことも結構あるのです。ですから、情報検索の精度を上げるには、この絞込み(掛け算)の際に用いるキーワードがポイントになります。商用の記事情報データベースの中には、この問題の発生を軽減する機能を持っているサービスもありますが、インターネット上の検索では現状で無理です。
次に、情報検索するときに入れるキーワードから考えてみましょう。キーワードは大きく自由語と統制語に分けられます。自由語というのは、文字どおり皆さんが自由に発想した言葉で検索する方式です。もちろん、インターネットを初めとして商用の記事情報データベースの殆んどが、この方法を採用しています。統制語は専門情報を取り扱うデータベースが採用していて、キーワード間の関係付けがされ、言葉の体系を持っています。特に親子関係が重要で上のテーマでは、「東南アジア」に対して「フィリピン」「インドネシア」「シンガポール」「マレーシア」・・等が子供のキーワードになり、「バリ島」は「インドネシア」の子で、「東南アジア」の孫になります。一般に統制語をサポートしているデータベースでは、親キーワードを指定しておけば、子や孫のキーワードは自動的にサポートされますので入れる必要がありません。これは大きなメリットです。自由語だけですと、親キーワードのほかに、子や孫のキーワードを羅列して、足し算(OR演算)で繋いでおかなければなりません。
このように統制されたキーワードの体系を「シソーラス」と言い、通常は数年毎にシソーラスの改訂を実施して、最新状態を保つ努力がなされています。便利な統制語ですが、インターネットや新聞・雑誌等の一般的な記事情報データベースはサポートしていず、一般情報では日本経済新聞社の新聞記事データベースのみが、唯一統制語をサポートしたサービスです。もちろん、科学技術文献等の専門的なデータベースでは、統制語をサポートしているのが普通です。
インターネットの普及によって、誰もが情報の受発信をできる時代になり氾濫する情報の中から必要な情報だけを抽出する情報検索スキルは、ますます重要になってくると思われます。本稿に述べたことをシッカリと憶えているだけでも、情報検索の仕方が変わってくるのではないでしょうか。
■執筆者プロフィール
中村久吉(なかむらひさよし) eri@nakamura.email.ne.jp
戦略の立案から、組織・人材・情報システムの最適化、及び情報リテラシ教育、個人情報保護対策、プライバシーマーク認証取得、ISMS(情報セキュリティ・マネジメントシステム)構築まで、一貫してサポートします。
ITコーディネータ、中小企業診断士、ISMS主任審査員、社会保険労務士