コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

Wikipedia‐ノート:すべての言語版にあるべき項目の一覧

ページのコンテンツが他言語でサポートされていません。

進捗度表記について

[編集]

リスト部分についての案を書いておきます。現在のリストはmetaとの照合用としての性格が強く、一般的な基準とは異なりますので英語版と{{CI}}を参考に考えたのですが、これぐらいでどうでしょうか。

: 秀逸な記事 - 秀逸な記事
: 良質な記事 - 良質な記事
: 元秀逸な記事 - 元秀逸な記事
: Delisted good article - 元良質な記事
: Aクラス記事 - A:30kバイト以上
: Bクラス記事 - B:10kバイト以上30kバイト未満
: Cクラス記事 - C:5kバイト以上10kバイト未満
: スタートクラス記事 - スタート:2kバイト以上5kバイト未満
: スタブ記事 - スタブ:2kバイト未満
: Non-article page - 記事無し
: リダイレクト - 現在リダイレクト

A/B/Cはmetaの3種類をそのままの数値で流用し、C以下をC/スタート/スタブに分けたものです。--Open-box会話2019年7月2日 (火) 13:51 (UTC)[返信]

スタートとスタブの追加に賛成します。バイト数はメタウィキのList of Wikipedias by sample of articlesで採用されている、英語の1.9倍とする基準を採用したいところですが、こちらはもう少しほかの方からの意見が欲しいところです。(英語の1.9倍という基準は、聖書のバベルの塔に関する記述の文字数比を由来としています。聖書を採用した理由はある程度の長さがあり、世界中の言語でおそらく最も多く翻訳されて、多くの言語で採用できるからです。1倍とした場合、英語版よりやや甘めの基準になりますが、他言語版との比較を重要視するかどうかで意見が分かれるでしょう。)--ネイ会話2019年7月3日 (水) 12:49 (UTC)[返信]
文学的記述を適用できるのか以前に、それ実験してみましたけど変じゃないですか? Windowsのメモ帳でコピーして行頭の数字を削って確認したのですが、日本語が1,714バイト、英語が1,179バイトなので1.45。数値は多少前後するとしても、実際には言語差がないコード部分が入るので差はもっと少ないはずです。他言語を試していないのですが、1バイト文字前提の判断でGoogle翻訳に入れて文字数だけカウントしてると思われます。日本語の1978年版をコピーしてGoogle翻訳に入れると597ですし、行頭の数字が入ってしまうんです。一方英語の2002年版をコピーしても数字は入らない。これは恐らく他の言語でも同様のミスを侵していると思われます。倍率かけるなら補正入れて1.4ぐらいですが判りやすく45/30/15/7/3(スタートとスタブは半分にして切り捨て)ぐらいでしょうか。--Open-box会話2019年7月3日 (水) 23:46 (UTC)[返信]
コメントメタのは正確にはテンプレートやマークアップ等を除いた「文字数」なので1.9倍は文字をカウントして掛けないとだめです。この文書の「バイト数」は私が昔、統計的に求めた近似値なので正確には一致しません(それぞれの境界値の記事のバイト数を抽出して決めています)。バイト数ならすでにあるツールでちゃっちゃと調べられるので、まあ、そうしたのですけどね。メタに正確に合わせたかったらメタのコードをもとにツールを作ったほうがよいと思います。(聖書の文は「敬体」なので「常体」の百科事典の場合2.2倍ぐらいのほうがより正確ではありますが)--Afaz会話2019年7月4日 (木) 00:08 (UTC)[返信]
(被ったけどほとんどそのまま)Wikipediaなのでコード無視したらだめですね。さてどうしましょう。一応バベルの塔の日本語部分を再チェックしたのですがこれ、1162(英語)/598(日本語)=1.95でやってますね。日本語版の10K記事は英語版の19K記事に相当する? というのであれば30/20/10の判定を日本語版に移入するならA/B/C判定は逆に16K/12K/8Kになりますし、これが単純に記事サイズのみ減少している時点で式の運用がおかしいです。多分metaがやりたかったのは、各言語の記事サイズx英語版に直す比率→A/B/Cを英語版基準値で分析です。バイト的に違いがないイタリア語で1162/1078=1.07→切り上げて1.1。この基準をバイト数(日本語版から数値を削り解説は残したまま)でやると1179/1714=0.68→切り上げて0.7です。これなら実感に近い(小さい記事の翻訳時にサイズの増減が半減するほどではないどころか増えることもある)ですし、medianもこれに近い日→英が0.77なので、weightの計算がコピペミスかつバイト差の考察落ちで異常値になっていると考えます。--Open-box会話2019年7月4日 (木) 00:29 (UTC)[返信]
あ、medianが補正後の中央値と勝手に考えてましたが、これ単純な中央値? だとすると平均と比較しても無意味ですよね。--Open-box会話2019年7月4日 (木) 01:06 (UTC)[返信]
  • Afazさんの2.2倍案で検討しますとこうなります。220(英語)/100(日本語)=2.2。面倒なので制御コードを無視し、英語の空白、日本語の結合文字も無視します。すると日本語は1文字3バイトなのでバイト数に変換しますと220/300=0.733になりますので、聖書の場合と比較すると0.5ほど増加しています。日本語記事にはラテン文字表記、数字などが入るため差は縮まりますので、0.75から0.8でしょうか。0.8で24/16/8、0.78で23.4/15.6/7.8、0.75で22.5/15/7.5。こんなところの合意をとるのは面倒だから30/20/10でいいような気もします。--Open-box会話2019年7月28日 (日) 01:31 (UTC)[返信]

十の項目を募集します

[編集]
各言語版の十の項目(記事1から10は元の言語版に合わせています)
言語版 コード 記事1 記事2 記事3 記事4 記事5 記事6 記事7 記事8 記事9 記事10
アッサム語 as 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
ビハール語 bh 文化 地球 世界の歴史 言語 生命 数学 科学 哲学 テクノロジー 芸術の種類
ベンガル語 bn 地球 世界の歴史 ヒト 生命 言語 芸術の種類 数学 哲学 科学 テクノロジー
カタルーニャ語 ca 芸術 地理学 歴史 生命 言語 数学 哲学 科学 社会 テクノロジー
ソラニー ckb 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
ギリシア語 el 地球 生命 ヒト 世界の歴史 文化 言語 芸術 科学 テクノロジー 数学
英語 en 芸術の種類 地球 世界の歴史 ヒト 言語 生命 数学 哲学 科学 テクノロジー
エスペラント eo 地球 生命 ヒト 世界の歴史 文化 言語 芸術の種類 科学 テクノロジー 数学
バスク語 eu 芸術 生命 ヒト 世界の歴史 言語 文化 数学 テクノロジー 科学 欠番(当初は地球が記事7)
フランス語 fr 文化 地球 世界の歴史 言語 生命 数学 哲学 科学 テクノロジー 芸術の種類
ガリシア語 gl 芸術 地球 世界の歴史 ヒト 文化 言語 生命 数学 科学 テクノロジー
ヘブライ語 he 芸術の種類 地球 世界の歴史 ヒト 言語 生命 数学 科学 テクノロジー イスラエル
ヒンディー語 hi 芸術 文化 地球 ヒト 世界の歴史 言語 生命 数学 科学 テクノロジー
アルメニア語 hy 地球 生命 ヒト 世界の歴史 文化 言語 芸術の種類 科学 テクノロジー 数学
アイスランド語 is 芸術 地球 世界の歴史 ヒト 言語 生命 数学 哲学 科学 テクノロジー
ラディーノ語 lad 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
ラーオ語 lo 文化 地球 世界の歴史 言語 生命 数学 哲学 科学 テクノロジー 芸術
マラヤーラム語 ml 芸術 文化 地球 世界の歴史 ヒト 言語 生命 数学 科学 テクノロジー
オリヤー語 or 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
パンジャーブ語 pa 地球 生命 ヒト 世界の歴史 文化 言語 芸術 科学 テクノロジー 数学
ノーフォーク語ピトケアン語 pih 地球 生命 ヒト 世界の歴史 文化 言語 芸術 科学 テクノロジー 数学
ポルトガル語 pt 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 社会 テクノロジー
アルバニア語 sq 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
タミル語 ta 地球 生命 ヒト 世界の歴史 文化 言語 芸術の種類 科学 テクノロジー 数学
ツォンガ語 ts グングンヤナ ツォンガ語 ネルソン・マンデラ 言語 地球 生命 ヒト 世界の歴史 文化 芸術の種類
タタール語 tt 世界の歴史 地球 数学 文化 芸術 言語 生命 テクノロジー 哲学 科学
ウクライナ語 uk 文化 地球 世界の歴史 言語 生命 数学 哲学 科学 テクノロジー 芸術の種類
ウズベク語 uz 哲学 科学 生命 世界の歴史 文化 数学 芸術 テクノロジー 言語 地球
ヴェンダ語 ve 芸術 地球 世界の歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
ベトナム語 vi 芸術 地球 歴史 言語 生命 数学 哲学 科学 文化 テクノロジー
中国語 zh 地球 生命 ヒト 世界の歴史 文化 言語 芸術の種類 科学 テクノロジー 数学

日本語版でも十の項目を運用するために案を募集します。最初に十の項目を日本語版で選ぶ参考として各言語版の項目を抽出しました。英語版の旧版の影響で、芸術の種類芸術)・地球世界の歴史言語生命数学哲学科学文化テクノロジーのセットが多いのですが、当の英語版が文化とヒトを差し替えているようにこれに限定する必要はありません。原則として千の項目の太字から選択が行われる予定ですが、他言語版で頻出する世界の歴史は千の項目にすら入っていませんし、芸術の種類に至っては千の項目どころかこの文章を書いている時点で日本語版がありません。また、一部の言語版は言語と密接に関連する項目を選出しています。ですからあなたの考える十の項目としてよりふさわしいと考えるのであれば、範囲外から選択しても構いません。--Open-box会話2019年7月28日 (日) 06:01 (UTC)[返信]

  • 1週間以上経過して特にコメントがつかなかったため、当方から「芸術、歴史、文化、ヒト、言語、生命、地球、科学、数学、テクノロジー」の案を推してみます。千の項目の太字から選出する上で無難な選び方ではないかと思います。--ネイ会話2019年8月7日 (水) 15:15 (UTC)[返信]

長期間放置されていましたが百の項目の整備案が上がってきたので、こちらに悪影響を及ぼさないためにネイさんの案を仮に適用しました。--Open-box会話2024年8月23日 (金) 03:21 (UTC)[返信]

凡例は不用かどうか

[編集]

分野別に分類していただき、とても使いやすいです。そこで分類後の子リストごとに凡例があると便利かと思いました。

以下、サンプルを試みましたのでご参照ください。Wikipedia:すべての言語版にあるべき項目の一覧/1万の項目より転写、たとえば「項目の数」の太字部分を除去、あるいは総数を指す項目をコメントアウトしました。 <!-- コメントアウト。*'''記事数''' - すでに記事のある項目。 -->

  • リダイレクト・他リダイレクト - 記事名が既にリダイレクトや曖昧さ回避などに使用されており、単独記事はないが赤リンクではない項目。
  • 記事なしNon-article page - 記事がなく赤リンクになっている項目。

<!-- *'''作成率''' - 記事のある項目の割合。記事数/項目数×100 (%) -->

かえって煩雑になるかとも思ったのですが、携帯端末で親項目まで遡及したところ、なにを調べていたのかわからなくなってしまい、上記を思いつきました。もっとよくできる点を修正いただけるとありがたいです。 --Omotecho会話2020年1月22日 (水) 14:30 (UTC)[返信]

Wikidataと異なる項目

[編集]

英語版 - 言語間リンクによる日本語版 - このページに書かれた項目

リダイレクトになっている項目

--FlatLanguage会話2024年3月7日 (木) 14:36 (UTC)[返信]

注釈付きで反映させました。--FlatLanguage会話 / 投稿2024年4月14日 (日) 06:30 (UTC)[返信]