コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

Wikipedia‐ノート:検索実験

ページのコンテンツが他言語でサポートされていません。

以下のコメントは、検索実験から移動したものです。


実験終えます。より詳しい情報求む。--Yoshitaka Mieda 20:18 2003年3月5日 (UTC)


僕は「詳しい方」ではありませんが、少し付け足します。

1.エラーの種類 検索不能にもいろいろ種類があるようです。

  1. 単にひとつもマッチが出てこないもの、
  2. Badly formed search queryというエラーメッセージが出てくるもの
  3. 奇妙なエラーメッセージと結果のリストが2重写しになるもの

と少なくとも僕は3種見ました。

3種目は例えば「インド/中国」「インド /中国」「インド/ 中国」などを使うと出てきます。 「インド / 中国」では出ません。

2.仮説

この内、+と+とplusについては、例えば "生成 and 文法"という風にするのと、andの部分を +などで置き換える場合とで全く結果が同じになるようです。そこで 「ブーリアン検索のand演算子の意味に解釈するように出来ているのではないか」 と最初は考えました。

&と&も、半角スペースも、同じくandを用いた場合と同じ結果になります。

ですが、それらの代わりに例えば*だとか/だとかを使って "生成 * 文法""生成 / 文法"などと検索してみると同じ結果が出るので、

「特殊記号の類はストップワードのリストに入っていて、無視される」 「結果、残った半角スペースから、2つのキーワードをand演算子で結んだ形の検索が実行される」 ということのように思います。

3.不明点

  • andの機能は何なのか、というとよくわかりません。「実験」と「実 and 験」とでは良く似ているけれども違う結果が出てきます。「生成文法」と「生成 文法」でも。
  • 何故aaaaは検索できてccccは結果が表示されないのか、は謎です。
  • ストップワードのリストに入っているものが、入っていないものに挟まれると検索可能になるというのはわかりますが、それが妙なエラーにつながる理由はわかりません。

Tomos 01:26 2003年3月6日 (UTC)


半角スペースのかわりに全角スペースを使った場合、例えば「生成 文法」にすると、「生成」と「文法」を含んだ記事のほかに、「生成」も「文法」も含まない記事も検索されてしまうようです。--Yoshitaka Mieda 21:53 2003年3月6日 (UTC)

実験結果の追加と、推測。

  • \,[,]は無視される(たとえば"\言語"は"言語"となる)。ただし、検索フィールドに"\"だけの場合、Badly formed search queryになる。何も入れない場合はメインページが表示される。

Bad Formed search queryが表示されたときの説明を見ると、3文字以下の言葉はうまく検索できない、とあります。日本語で一文字「あ」のものがうまく検索できているのは、UTF-8で日本語が3バイト以上の長さを持つ(はずです、うろ覚え)からかもしれません。/+\[]といった文字が無視されるのは、おそらく正規表現との兼ね合いだと思います。一番いいのはソースコードをダウンロードして確かめてみることですが……今度やってみます。さしあたってはWikipedia:Searchingを読んでみます。

それから、原因の推測などはここではなくWikipediaネームスペースのWikipedia‐ノート:Searchingなどでやった方がいいと思うのですが、いかがでしょう? Sketch 04:07 2003年3月6日 (UTC)


Boolean演算は重いので無効になっているというのきたことがあるのですがその点はどうですか? -- TakuyaMurata 06:15 2003年3月6日 (UTC)

少なくともandとorは使えるようですね。英語版ではサーバーへの負荷が高いという理由でアクセスカウンターも表示されないようになっていますが、日本語版では表示されています。それと同じようなものかも知れないですね。Tomos 21:18 2003年3月6日 (UTC)


今朝、実験したときはccccが確かに検索できなかったけど、今はできるようです。不思議だ。 --Yoshitaka Mieda 09:45 2003年3月6日 (UTC)

やはり、元のページに頂いたコメントがccccの検索結果に影響したようだ。ここにコメントを移動させるとまたccccで検索できなくなった。--Yoshitaka Mieda 10:25 2003年3月6日 (UTC)
よく調べるとaaaaの前後は半角空白、ccccの前後は全角空白になっていた。おそらくこれが検索の結果に影響したのだろう。--Yoshitaka Mieda 19:23 2003年3月6日 (UTC)

新しい検索機能、とても結果が変ですね。。。みなさんはどうですか?Reds 15:18 2003年12月9日 (UTC)

Wikipedia:検索実験に関する議論を始める

新しい議論を始める