コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:Mage Whopper

Mage Whopper(まげわっぱ)です。曲げわっぱMega Whopperの中間を目指して頑張ります。

2009年4月status: やや上向きで活動再開します。

オートマータ

[編集]

Botとか、らくちんとか

作業の案

[編集]

※単純にアイデアだしのみです。作業するかどうかは未定。

Wikipedia辞書

[編集]

Wikipediaのデータを元にした辞書作成は各所で行われてます。

下二つはCRF学習で辞書を自動推定したもののようです。


プロジェクト ソースを探そう

[編集]

MeCab Projects

[編集]


サブページ

[編集]

雑感

[編集]
  • Wikipedia:今週の強化記事Wikipedia:多数の言語版にあるが日本語版にない記事Wikipedia:加筆依頼Wikipedia:短いページなど、記述の充実や加筆を促すページは一応存在しています。それぞれのページで活動がされているのかどうかは非常にチェックしにくく、機能しているのかどうかはぱっと見ではわかりません。特別ページの中に特別:存在しないページへのリンクとか特別:短いページもあるようですが、機械的な集計ではあまり用を成していないように見えます。
  • 項目の評価をしているのはWikipedia:査読依頼Wikipedia:秀逸な記事ぐらいしか無いのでしょうか。執筆された記事がどういう評価なのかを客観的な判断は専門家でも難しいものですが、だからこそ、定量的に切り込んでいける部分は積極的に評価していったほうがいいのではないか。
  • (memo)参考文献の数は挙げただけではしょうがないけれど、refの数、ref数とページのサイズの比、とかは指標になりそうです。
  • ページを加筆/修正するページはたくさん用意されているのに、ページの成長自体を見守る機構が存在していないようなのがいろいろなことの原因のように思われます。(調査中)
  • こんな風にすれば基本情報はとれそうです。
  • 2007年4月15日くらいを境に、それ以前のrevisionsテーブルはサイズやフラグ(M/N/bot)の情報を持っていない様子。自前で持つしかない?
  • Mediawiki APIはformat=phpでphpでも便利に使えるけれど、JSONもあるからJSでいけるのではないだろうか。JSでSVGを生成したものをJSで作った子windowに表示ぐらいはできそう。そこまでするのはかなり面倒。。