コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

ノート:検索/draft

ページのコンテンツが他言語でサポートされていません。

検索けんさく)とは、データの集合の中から目的とするデータを探し出すことである。古くは図書館の所蔵物を探し出したり、辞書の項目を引いたりといった人間系が主な検索だったが、コンピューターの発達により、テキスト文字列の検索(文書検索文字列探索)、画像データの検索(画像検索)、音声データの検索(音声検索)など、大規模かつマルチメディアの情報に関する検索技術が発展した。さらにデータベースの発展とインターネットの普及に伴い、P2Pネットワークなどにおいて分散保管されているデータに対する検索技術が研究されている。テキストエディタなどでファイルの内容に対して文字列探索を行う機能も検索と呼ばれる。

歴史

[編集]

日本ではコンピュータ技術の発達により1970年代に「情報検索システム」が始まり、言葉としての「検索」は次第に広く使われ始めた[1][2]。英語の文化圏では言葉としての「検索」は犬のゴールデン・レトリバーに見るように「探しだす」を意味する「Retrieval」や「Retrieve」として古くから使われている[3][4]

日本語における言葉「検索」の意味合いと使用例において大まかに次の様な変遷が見られる。

意味合い

[編集]
  • 広辞苑1998年平成10年)11月改訂)第5版までは、「検索」の意味として単に「調べさがすこと」、使用例として「索引で語を検索する」書かれている。この時代頃までは一冊の本または複数冊の本の中に記述される事柄を探す事が主な言葉としての検索の使われ方であった。「検索」より、むしろ単に「見つける」、「探す」「探索」などが一般的な言葉として馴染まれ使われている[5]。検索して目的とする言葉が見つからなければ、他の本を手にとって調べてみることとなる。このことはコンピュータによる情報検索が行える現代においても図書館や本屋において誰しも試みることである。一方、図書館では蔵書に対して「目録カード」や「カード目録」などと呼ぶ名刺大から葉書大程度のカードから所用の本を探し出したが、この様な検索は蔵書検索と言われ、現在でもコンピュータなどによる情報検索と併用されている[6][7][8]
  • 広辞苑第6版(2008年平成20年)1月改訂)では検索の意味として「データの中から、必要な事項をさがし出すこと」とし、コンピュータの中のデータや、紙やマイクロフィルムに記録されたデータの中から探し出す、現在の検索への意味合いへと変化が見られる。使用例は変わっていない。(なお、広辞苑5版から6版の10年間にも、1948年昭和23年)以降毎年刊行される「現代用語の基礎知識」には検索エンジンなどの解説はあるが、言葉「検索」そのものの解説はない。)
  • 言葉「検索」の意味を日本語と英語で比較すると、情報検索に対応する英語はInformation retrievalであり、その名詞 retrievalの動詞 retrieve[9]は日本語の「検索」に相当するが、日本語の意味合いの「データの中から」と言う「特定の情報の集合から探し出す」ことは英語の「retrieve」に含まれず、日本語の検索が現代のカードやコンピュータなどにより探し出す事に限定した意味合いへと変化している事が判る。

使用例

[編集]
  • 日本語を対象としたコンピュータの文書ファイルに終始する中での言葉や句の検索は、「検索」の機能を備えた1978年(昭和53年)9月に東芝が発表した世界初の日本語ワードプロセッサJW-10に始まり、その後OASYSなどのワードプロセッサや1983年昭和58年)の一太郎の元となるPC-100用日本語ワープロソフト「JS-WORD」などが開発され市場に出されたことより、コンピュータを使った「検索」とはどのような意味か、どのように速くて便利なものかをコンピュータのユーザの立場で体感できることとなる。1983年には米国で作られた表計算ソフトLotus 1-2-3を日本でも一部の者は使い始めが、これにも表内の検索やLotus 1-2-3独自のマクロによる検索の機能を備えていた。
  • 1989年平成元年)にはパソコン通信による遠隔地からデータベースの情報を探し出す「G-Search」の検索サービスが開始された。これは新聞・雑誌記事、企業情報、特許、科学技術、図書、人物プロファイルなど、さまざまな分野の情報を扱ってきた。これは膨大なデータや情報を「検索」によって見つけられることを示した日本での実例の始まりであった。その後、インターネットの通信技術向上による速度向上とサービスの多様化よってパソコン通信による「G-Search」の検索は2005年9月にサービスを終え、インターネットを介したものとなっている[10]
  • 2006年頃までは紙を主体にした宣伝広告や広報のなかでURLを表記して広告内容の詳細を更に調べたい者に対して案内としたが、インターネットの利用が極めて一般的となった2007年ないし2008年頃からは広告の最後に【○○○ 検索←】の様な形式で、紙の媒体だけでなく、TV放送のCMにまで広告主の案内や広告のテーマ話題を直ちに検索する事を促す手法が一般化した。

情報検索

[編集]

情報検索 (: information retrieval)は、広義には、あらかじめ蓄積されている情報の中から必要な情報を探し出すことを指し[11]、しばしば検索と略される。

情報科学においては、文書(あるいは画像や音声)集合の中からユーザーの要求にもっともよく適合する文書を取り出すシステムのことを情報検索システムと呼ぶ。 情報検索システムにおいては、本来形式化されていないユーザーの要求をコンピュータで取り扱えるようにするために検索モデルが設定される。 たとえば、ベクトル空間モデルは、文書に索引を与えて、問い合わせとして与えられたキーワード集合と索引の重複の度合いから目的の文書を探し出す検索モデルであり、 全文検索は、問い合わせとして与えられた文字列やパターンに完全に一致する部分を文書集合から探し出す検索モデルである。 [12]

文字列検索と全文検索

[編集]

情報科学において、文字列探索は文字列の中から別の文字列を探し出すという問題であり、全文検索の一つの形態である。 主にテキストエディタなどの比較的小さな文書に対する検索において用いられる。巨大なテキストデータベースに対しては、時間がかかりすぎることから、あまり用いられない。 [13]

探索

[編集]

情報科学における探索(: searching)とは、いくつもの候補を列挙し、それぞれをひとつずつ評価していくことによって、最適解を得る手法を指す。 探索に用いられるアルゴリズムデータ構造は、問題の性質や構造によって異なる。 たとえば、木構造 (データ構造)グラフ (データ構造)の探索に用いられる深さ優先探索、 ランダムアクセスが可能なデータ構造が使える状況でソート済みの入力に対して用いられる二分探索、 よいハッシュ関数が作れる場合に用いられるハッシュテーブルなどがある。


データベースと検索

[編集]

参考文献・脚注

[編集]
  • 北研二、津田和彦、獅々堀正幹『情報検索アルゴリズム』共立出版、2002年。 
  • 『情報検索の基礎』情報科学技術協会 編集、日外アソシエーツ、1995年。 

関連項目

[編集]