Wikipedia‐ノート:全言語版の統計 - 記事数の推移
Quartoからのリンクでやってきました。データが古い(半年前)ので、どなたかアップデートして下さる方がいると嬉しいです。--Aphaea 2004年9月14日 (火) 01:42 (UTC)
- ランキングの更新ありがとうございました。並び替えがなされているようですが、どのような基準で並べられているのでしょうか。ロシア語やブルガリア語が下におかれている理由があまりよく分かりませんでした。--Aphaea* 2005年1月5日 (水) 07:09 (UTC)
12/31に61.126.216.156さんが上位20言語の記事数を調べて書き込んでいたので、その数字順に並べ直しただけです。記事数が正しいかどうかの検証はしていません。 --Hachikou 2005年1月5日 (水) 08:57 (UTC)
このページの整備について
[編集]井戸端にも少し書きましたが、表題の件について一旦整理しておきたいと思います。まず、6月5日の編集の後、事実上更新が止まっておりましたので、en:Wikipedia:Multilingual statisticsからデータを移植し、10月1日分まで更新しました。英語版も含めて、小計・合計がかなり間違っていたので、過去ログ作成のついでに表計算ソフトにすべての数字を入力し、検算を行いました(その結果は英語版にも反映しておきました)。その後、ランキングページも翻訳し、掲載しました。
ここから先が問題です。両者のデータソースが異なるためか、一覧とランキングの数値は明白に異なります。wikipedia英語版は2001年1月からスタートしたはずですが、一覧の方の2001年1月は空欄になっており、ランキングはそうなっていません。そのほか、数値にかなりのばらつき、小計・合計の誤りが見られます。たとえば、英語版の一覧には投稿者が次々に数字を足していっていますが、その際カラムに数字だけ足して、合計に合算操作をしない投稿者が散見され、数字がかなり混乱しているように見受けられます。主投稿者も、新しく活発になったwikipediaに目が届いていないように見えます。11月分の英語版の更新では、計9言語版が欠落していました。
このままでは信頼性に疑問符が付きかねませんので、せめて日本語版だけでも、後でmetaの2005年6月分までのcsvファイルをもとに、すべて書き直す予定です。なお、2005年11月1日のデータから、すべての言語版を手動・肉眼で見て回る(=効率は悪いですが確実な)方法で、毎月1日にデータ収集を行い、その数値を元に反映しています。基準はあくまで毎月1日です。要は、毎月の変動が把握できれば良い訳です。英語版までは手が回りません。
また、ランキングについても、途中フォーマットが不統一な部分がありますので、検算をし直したいと考えています。なお11/01のランキングは、スクリプトが完成していませんので、英語版に登場し次第翻訳します。
上記の作業群は時間がかかりますが、いずれ完了させるつもりですので、もう少しお時間を下さい。--Diagraph01 2005年11月3日 (木) 06:22 (UTC)
「多言語の統計」カテゴリ作成について
[編集]en版Wikipediaにならい、各々の「多言語の統計」ページにカテゴリを附加していきたいと思います。Category:ウィキペディア多言語の統計--ぱむ 2005年11月28日 (月) 02:15 (UTC)
なぜポーランド語の記事が日本語より多いの?
[編集]なぜポーランド語の記事が日本語より多いの?この理由を説明できる人いますか?2006年9月1日 (金) 03:18 (UTC)
改名提案
[編集]Wikipedia:全言語版の推移への改名を提案します。(移動先ページ名については仮称ですので、御意見をお願いします) 理由は下記の通りです。
- 「多言語」だと、複数の言語で書かれている、あるいは「言語そのもの」についての統計であるかのような印象を与える。(Wikipedia名前空間ではありますが、それでも「多言語の統計」が「ウィキペディアの各言語版の統計」を意味するとは思えません)
- ウィキペディアの一覧からWikipedia:全言語版の統計への改名提案をノートで出していますが、そちらの方が扱っているデータの種類が多く(記事数の他にも、編集回数や利用者数など)、また最新の統計だけですので「統計」という名前が適切だと思います。このページは「記事数の推移」に焦点を当てているため、統計ではなく「推移」という語句を用いた方が良いと思います。(あるいは「記事数」なども加えた方が良いかもしれません)