Wikipedia‐ノート:すべての言語版にあるべき項目の一覧
過去ログ:
- 2005年4月30日までの議論 - 変なリスト、リクエスト、使用法と次のステップ、全面更新のお知らせ
- 2017年10月2日までの議論 - この一覧の改善について、この一覧の利用法について、進捗度、憎悪、辞書訳との不一致、すべての言語版にあるべき項目の意味、Trainの対応、変なリスト、出典追加のお願い、改訂しました、生殖系、再改訂しました、良質な記事、New real time list of missing articles、「万の項目」の作成提案
十の項目について[編集]
十の項目についての議論は、このノートのサブページWikipedia‐ノート:すべての言語版にあるべき項目の一覧/十の項目を参照してください。--Afaz(会話) 2019年6月25日 (火) 23:45 (UTC)
- それはまだだめです。実は十の項目って提案無しの上に、実は十の項目じゃないんですよ。なので議論はこちらなんです。--Open-box(会話) 2019年6月26日 (水) 00:14 (UTC)
Wikipedia:すべての言語版にあるべき項目の一覧/十の項目が作成されましたが、いくつか深刻な問題があります。まずこれは、英語版の整備目標リストen:Wikipedia:Vital articles/Level/1(Level1)でありmetaの「すべての言語版にあるべき項目」ではありません。これは、100のLevel2と5万のLevel5とも共通しています。つまり、この3つについてはそもそも文書名が間違っているので格納場所から考える必要があります。千の項目にしろ万の項目にしろ、本質的には「ネタ帳」でしかありませんが、10や100ぐらいになると「ネタ帳」としても使えません。Level2までは絞りすぎた結果不自然な選択をされているので、「数が多く必要なものをカバーできるが、多すぎて客観的にはおかしい物もある」千の項目・「詰め込んだ結果、どう考えてもおかしいけど必要なものはカバーされている」万の項目とは本質的におかしさの方向が違います。これを「すべての言語版にあるべき項目」としてさも特別なものであるかのように掲げるのはむしろ害が有るのです。また日本語版としてこれぐらいはFA目指そうとするなら、本質的に違ったものになるでしょう(おそらく、千の項目・万の項目から独立して、富士山や織田信長等の日本のものになると思います)。そしてFAを目指すという究極の目標は、他言語版に強制される性質のものでも、重要度に左右される性質のものでもありません。よって中立性に問題がある、英語版の翻訳に過ぎないという2点は看過できません。次のいずれかの対処を提案します。
- 十の項目の削除:簡便な手法です。
- 十の項目の改名:文書としては廃案あるいは私案化し、英語版の翻訳による参考資料に過ぎない事を明確にします。妥当な改名先があれば、こちらで。
日本語版はしばしば英語版の翻訳でいいという問題行為が発生するので、後々のためには改名が妥当だと考えます。--Open-box(会話) 2019年6月26日 (水) 00:14 (UTC)
- コメントウィキペディア文書が逐語的に同一な文書名にすべきかというと、別にそんなことはないので、これでいいと思いますが。Wikipedia:Vital articlesに対応した日本語版文書はWikipedia:肝心な記事ですが、歴史文書ですし。Open-boxさんの深刻な懸念がどうも理解できないのですが、一覧にそもそもFAを強制するような力なんかないし、FAを目指すべき一覧と書こうが、なにかを拘束するものではないのはご存知のとおりです。十の項目の害とは、10項目にウィキペディア日本語版がなにかしらお墨付きを与えたと解釈されるからですか? ならその旨を冒頭に注意事項として書けば良いだけかと思います。--Afaz(会話) 2019年6月26日 (水) 00:59 (UTC)
- かなり違います。まず文書の性格が違うものを同じ所に入れる事自体が問題です。1000と10000はmetaで選定されたネタで、議論参加者には「欧米(特に英語圏)POV」であることは知られていますが、それでも「metaのリスト」であること「すべての言語版にあるべき項目」と呼んでも差し支えないものであることは確かです。冒頭部で所詮はmeta由来のネタ帳でしかないって断りは入れた方がいいですけど。一方10、100、50000は、英語版限定の整備目標であって「すべての言語版にあるべき項目」ではなく、10の段階で既に「POV」だったりしますのでここには置けません。そもそもこの文書に限らず「英語版から翻訳すれば妥当」と機械的に考えることが間違っているんです。英語版は英語版なりの偏向(特に単位と出典の取り扱いに問題があります)、規模による運用の差、過去の経緯による対処などやはり独特のものがあり、普遍的なものではありません。また、日本語版で新たに10を選ぶならそれは既に今回翻訳された「十の項目」ではないんです(日本語版で選ぶと哲学か芸術が外れる気がします。入るのは、天文か宇宙でしょうか?)。そう考えますとそもそも「Wikipedia:すべての言語版にあるべき項目の一覧」という名称が間違っているとも考えられます。これは本来「Wikipedia:整備目標」みたいなページを作りまして、1000、10000もそこのサブページに移す(metaで提案された千の項目ぐらいでいいでしょう)、「十の項目」も「/十の項目/英語版」みたいに細分化していくなど、「すべての言語版にあるべき」なんて余計な修飾を省けば中立的に対応できますし、拡張も容易で、翻訳もどんどんできるんです。この方向で改名案を考えるなら以下のような構造になるでしょう。
- Wikipedia:整備目標(すべての言語版にあるべき項目の一覧の冒頭部を中心に作成、en:Wikipedia:Vital articles相当のページ)
- metaで提案された千の項目(すべての言語版にあるべき項目の一覧の一覧部分)
- metaで提案された万の項目
- 分野別サブページ
- 十の項目(とりあえず案内ページ)
- 英語版で提案された十の項目(今回翻訳部分)
これなら日本語版に対するPOVを「日本語版以外からである」と宣言することで回避できますし、meta以外の文書を翻訳しても問題にはなりません。将来的にはプロジェクト的な整備目標も取り込めそうですが、いかがでしょう。--Open-box(会話) 2019年6月26日 (水) 02:03 (UTC)
- 冒頭部だと上手くないのでWikipedia:整備目標のたたき台的に書いてみます。
Wikipediaにおいて、この記事は充実した内容の記事として執筆されるべきであるとする目標が様々な人々によって考えられています。以下に挙げるのは、各所で考案された整備すべき記事の一覧です。未執筆から執筆を重ねて、スタブ、小規模な記事、充実した記事、Wikipedia:良質な記事を経てWikipedia:秀逸な記事を目指してより充実させることが期待されています。 スタブからFAまで簡単な説明文 サブページリスト
- 雑に考えましたが、まずこれぐらいを手始めにしてはどうでしょう。もちろん文章部分を最初から充実させることがそれに越したことはありません。--Open-box(会話) 2019年6月26日 (水) 02:52 (UTC)
- コメント 本質的には「ネタ帳」でしかないというのは、これらのリストを過小評価していると考えます。例えば、Wikipedia:全言語版の統計では千の項目の充実さを評価して、各言語版を比較できる点数を挙げています。メタで作成された1万の項目もおそらく同様な使い方ができるでしょう。十、百の項目は、元の名前であるVital articlesが表すように「不可欠な記事」であり、それこそその十、百の項目がなかったら百科事典とすらいい難いという記事のリストなので、ウィキペディア以外の百科事典との比較で役に立つと考えます。また、「日本語版としてこれぐらいはFA目指そう」というリストの作成にも賛成します(こちらは「日本語で書かれる百科事典には不可欠な記事」という形で役に立つので)。したがって、下記の2点を提案します。
- 十の項目に含まれる記事を改めて審議し、日本語版で合意形成します。土台となるのは現時点の10記事ですが、今回の合意形成でも、以降でも記事の変更提案は日本語版で受け付けるものとする。
- 十、千、1万の項目とは別立てで、「日本語版としてこれぐらいはFA目指そう」(仮称)のリストを作成します。
- ページ名からはメタで選出されていることを見出せないので、それを重要視せず現行のようにサブページにまとめていいと思いますが、改名すべきとする方が多い場合はそれに従います。廃案・私案化は明確に反対します。
- 「FAを目指す」という目標は、本来ならば千の項目と1万の項目でも記載されてしかるべきものです。まるで十の項目のみがFAを目指すという主目標を持つかのように見える説明文としてしまったことには、私の落ち度があると思います。その節は申し訳ありませんでした。説明文の変更については、本節の合意形成を待ってからにしましょう。--ネイ(会話) 2019年6月26日 (水) 01:41 (UTC)
- 過小評価ではありません。そもそも日本語版では旧来よりmetaの両リストの偏向は指摘されており、決して普遍的な目標たり得ません(実は「欧米(特に英語圏)POV」とは無関係なところでも問題が大きいんです)。またmetaの点数に本質的価値はありません。metaの絶対視でしかなく、言語間の差異により作り得ない記事(例えば日本語では本質的に「rat」は作れません。他言語の認識を反映した異質な記事になるでしょう)、人種差別的な対象記事の選定などの問題はmetaにあることをもってして無問題とはなりません。さらにバイト数はテンプレート、表現、文字コードなどでも増減します。そんなもので言語間の評価を行おうというのは、所詮はmetaのお遊びに過ぎないのです。「十、百の項目がなかったら百科事典とすらいい難いという記事のリスト」というのも明白な詭弁です。その程度の項目はあって当然であることと、特選することとは何の関係もありません(その基準では万の項目でも足りません)。この部分は、寸分足りとて考慮する余地はありません。はっきり書きますが、英語版を導入すれば良いとして安易に粗雑な行為を繰り返すあなたの行為は少なからず問題となっています。このような全体に影響することは、それが何かを考えてから着手するべきものです。--Open-box(会話) 2019年6月26日 (水) 02:03 (UTC)
- 千の項目と1万の項目の偏向を問題とするのであれば、Wikipedia:すべての言語版にあるべき項目の一覧で説明されている通り、メタウィキでのトークページで指摘できます。また、バイト数についてはmeta:Talk:List of Wikipedias by sample of articles/Archives/2007#Proposed weighting of characters for formula_.28Option.232_using_Babel_text.29の議論により、言語ごとに調整されており、ある程度解決が試みられています。(「他言語の認識」についての記事もあっていいとは思いますが、要点ではないでしょう。)他言語版と比較する指標はあってしかるべきものであり、現行の指標に不十分なところがあったら「metaのお遊び」と切り捨てるよりその改善を試みるべきのではないでしょうか。同様の理由により、「metaで提案された」といった風に修飾すれば解決するものでもないと考えます。
- 十の項目と百の項目については、千、1万といった多数の項目よりも「中心的」な項目を選び、「ウィキペディア日本語版では中心的な百の項目で比較した場合、百科事典Aの内容よりはるかに貧弱であるが、1万の項目の多くを収録していない百科事典Aより手広くカバーしている。中心的な百の項目を強化した場合、質・量ともに百科事典Aを追い越すための近道となる」といった比較ができると思います(千の項目でも同様の比較ができますが、どこまで「中心的」にこだわることが違いとなります)。「日本語版で新たに10を選ぶならそれは既に今回翻訳された『十の項目』ではない」との意見については、日本語版で新たに10を選んでも特に支障はありませんし、今回翻訳された十の項目を必ずそのまま残すべきとも言っていません。実際に「日本語版で選ぶと哲学か芸術が外れる気がします」という意見をいただいていますし、(具体的な項目選びへの意見ではあるが)6、7項目ぐらいは日本語版で選んでも同じものを選ぶこととなるということで、土台として正しく機能していると考えます。
- 十の項目に対するコメントにもう1つ返答しますと、天文か宇宙は地球とやや被るところがあると思います。地球を天文か宇宙に置き換えるのはどうでしょう。(天文か宇宙かについては甲乙つけがたいところですね)また、日本語版では哲学か芸術が外れると考えた理由をお聞かせいただければ幸甚です。
- 上記の返答から、単に「英語版を導入すれば良い」と考えているわけではないことがおわかりいただければと思います。--ネイ(会話) 2019年6月26日 (水) 16:11 (UTC)
- コメント「偏向」というより「観点の混合物」ですね、現在は。一覧が作られた当時は欧米偏向でしたが、15年も経過した今はアラブ人、インド人、ロシア人、中国人…等々の観点が混ざり合ってグローバルに「中立的」になり、同時に日本人の観点からはかなり遠いものになっています。そこが面白いんですが。中心的な10項目についてはこの一覧からのみ選択し、英語版からの翻訳をしないということでどうでしょう。それなら、その10項目は依然「すべての言語版にあるべき項目」であり続けますし、メタの観点から日本語版の観点で取捨選択した縮小版ということで、英語版の観点が混ざることはありません。Open-boxさん提案の「Wikipedia:整備目標」も良い案ですが、観点の異なる文書が混在することが「重要な問題」なら、その案は取れないように思います。--Afaz(会話) 2019年6月26日 (水) 23:24 (UTC)
- コメント ちょっとレベル的に読みにくいかも知れませんがここで。
- 必要なのは書くべきもの・書きたいものを書いて記事を育てることで、他言語版と見かけの数値を争うことではありません。
- (ネイさんへ)十の項目と百の項目ですが、どちらも少なすぎてそれ故に基本項目としては運用しにくいです。「百科事典Aの内容よりはるかに貧弱であるが、1万の項目の多くを収録していない百科事典Aより手広くカバーしている」と考える場合、重点強化項目的に使いどんどん差し替えていくのですが、それはまた別の方向性です。万にはこの傾向がありそうですが、今度は多すぎて困ります。つまり土台として正しく運用することは現状では問題が大きいです。日本語版は英語版に積極的に合わせようとするケースが少なからずあるので、英語版を翻訳した時点でそれは困難です。
- 誤解している人が多々いますが、大項目主義の百科事典でも個々の項目は結構薄いのでBでも十分だったり。
- コモンズで意見をと言うのは非現実的です。私の分野ですと人物を乱発したり、「各国の通史」か「主題別の歴史」を掲げるところで王朝並べたり、国と都市を並立で扱う割に調整が甘かったりするセンスでは対話の余地がないです。この種の思考の硬直性(metaの選択はむしろ、「この手の記事」を書こう的方向性で百科事典としてのそれとはずれていると考えます)を変えることが可能と考えるのは、ただの慢心でしかありません。metaに限らず横断的なプロジェクトは再三再四個別のプロジェクトに悪影響を及ぼしており、これらに安易に合わせるのは危険です(そしてその割に英語版から使えそうなものは入らないんですけどね)。記事の評価で隠れた大きな問題点として分割の影響もありますし、各言語版の特徴で日本語版は分割やデータをあまり好まず、英語版はざくざく外に出しちゃうしデータも単独化、スペイン語版は外に出すものは付録扱いで記事ではない扱いとか、英語版のテンプレート病とか、査読をかませる一部の言語版とか無視できない問題はそれぞれにありますので引きずられるべきではありません。
- で、英語版のいいところをと考えるなら、metaの影響のある現在のA/B/Cよりはスタートとスタブまで組みこんだ英語版の表記がいいかなと思います。これは下に書いてみます。
- (おまけ)「哲学か芸術が外れる」というのは簡単で、これは無意識なのか意図的なのかはさておき、文化を差し置いて芸術・哲学ってところにヨーロッパ系の大学文化(リベラル・アーツ)を引きずってるのが見えるんです。数学はアメリカの影響がみられますが(独立した節を数学が持ってる時点でmetaにも影響してます)、数学は日本語版でも入ると思います。ヒト・科学・言語ぐらいが固定であとは参加者によるでしょうね。
- (Afazさんへ)新たに選定するにしても、そのまま使う場合であっても、レベルの切り分け(千がルートに同居しているのは単純にまずいです)と改名(一部が「すべての~」ではなくなるため)は必要になります。千も現状グローバルに「中立的」ではないですね、ちょっとだけ追加して調整してってやってますけど、スタート地点の影響は強く残っています。
- そして「観点の異なる文書が混在する」のは当然であって、観点が違うことを隠すことが問題なんです。
- 中心十項目を太字からとの案、いいね! と思って確認してみたんですが、実はScienceとかNatureが落ちるのでさすがにそれはまずいんじゃないかと。Food、Algebra、Geometry、Transportなども落ちますし、あの太字は100としても首をひねるんですよね。
- ついでに10の項目を持っている主要言語版から並べてみました。
- 英語版:芸術の種類(日本語版無し、artとthe artsは別扱い)、地球、世界の歴史、ヒト、言語、生命、数学、哲学、科学、テクノロジー
- フランス語版:文化、地球、世界の歴史、言語、生命、数学、哲学、科学、テクノロジー、芸術の種類(日本語版無し)
- ポルトガル語版:芸術、地球、世界の歴史、言語、生命、数学、哲学、科学、社会、テクノロジー
- 中国語版:地球、生命、ヒト、世界の歴史、文化、言語、芸術の種類(日本語版無し)、科学、テクノロジー、数学
- ちょっとずつ違うので、日本語版も独自に選んだ方がよさそうですね。--Open-box(会話) 2019年7月1日 (月) 14:39 (UTC)
- 本来ならば今日で用事が終わりウィキブレイクをあける予定ですが、また急用が入りましたので、とりあえずお返事があったことを承知したとだけ言っておきます。詳しい返信はウィキブレイク明けに行います。--ネイ(会話) 2019年7月2日 (火) 07:38 (UTC)
- いえいえ、お気になさらず。選考もありますし、のんびり行きましょう。--Open-box(会話) 2019年7月2日 (火) 13:35 (UTC)
- ここで「メタウィキを変えましょう」「変えられると思うのは慢心です」と議論しても水掛け論なので、それより物は試しということで、メタウィキのほうで1つずつ提案してみます。
- (数え違いがなければ)太字は240件あり、これだけ多いのにScienceとNatureが太字でないのはおかしいとの考えに同意します。したがって、メタウィキでこれら2件を太字にするよう提案してみました。(いっぺんに大量に提案しても仕方ありませんので、それ以外の4件は上記2件が決着した後に検討しましょう。)
- Afazさんの10項目を千の項目から選ぶとの提案に賛成します。太字のみから選ぶとの縛りをつけなければ、大丈夫だと思います。
- 重点強化項目としてどんどん差し替える方向性は人手不足の日本語版で機能するかがわかりませんが、アイデアとしては面白いと思います。むしろこの方向性こそが「Wikipedia:整備目標」といえるのではないでしょうか。
- 「哲学か芸術が外れる」理由は、承知しました。ここまでで一旦まとめますと、「世界の歴史、ヒト、言語、生命、数学、科学、テクノロジー」の7項目は異論なしで、「哲学か芸術を外して、天文か宇宙を入れる」「地球を外して、天文か宇宙を入れる」の2提案が出ています。ほかにも「芸術を外して、文化を入れる」といった案も考えられます。わたしとしては、まず異論なしの7項目を確定させたほうがいいと考えていますが、いかがでしょうか。
- 千の項目をルーツページに置くべきではないのは賛成しますが(1万の項目と平等にすべきであると考えます)、詳しい改名案についてはもう少し考えさせてください。--ネイ(会話) 2019年7月3日 (水) 13:32 (UTC)
- 本来ならば今日で用事が終わりウィキブレイクをあける予定ですが、また急用が入りましたので、とりあえずお返事があったことを承知したとだけ言っておきます。詳しい返信はウィキブレイク明けに行います。--ネイ(会話) 2019年7月2日 (火) 07:38 (UTC)
- 過小評価ではありません。そもそも日本語版では旧来よりmetaの両リストの偏向は指摘されており、決して普遍的な目標たり得ません(実は「欧米(特に英語圏)POV」とは無関係なところでも問題が大きいんです)。またmetaの点数に本質的価値はありません。metaの絶対視でしかなく、言語間の差異により作り得ない記事(例えば日本語では本質的に「rat」は作れません。他言語の認識を反映した異質な記事になるでしょう)、人種差別的な対象記事の選定などの問題はmetaにあることをもってして無問題とはなりません。さらにバイト数はテンプレート、表現、文字コードなどでも増減します。そんなもので言語間の評価を行おうというのは、所詮はmetaのお遊びに過ぎないのです。「十、百の項目がなかったら百科事典とすらいい難いという記事のリスト」というのも明白な詭弁です。その程度の項目はあって当然であることと、特選することとは何の関係もありません(その基準では万の項目でも足りません)。この部分は、寸分足りとて考慮する余地はありません。はっきり書きますが、英語版を導入すれば良いとして安易に粗雑な行為を繰り返すあなたの行為は少なからず問題となっています。このような全体に影響することは、それが何かを考えてから着手するべきものです。--Open-box(会話) 2019年6月26日 (水) 02:03 (UTC)
- (インデント戻す)一応こちらで報告しますと、上記でOpen-boxさんが言及していた太字の問題点について、FoodとGeometryは実は日本語版で更新されていないだけでメタウィキではすでに太字入りしています(ので日本語版でも更新しました)。また、Science、Nature、Algebraの3件はメタウィキでの提案を経て太字入りとなりました。Transportは提案しておらず保留としています。10の項目を千の項目の太字から選出することへの障害は特になくなったものと思いますが、いかがでしょうか。--ネイ(会話) 2019年7月23日 (火) 03:17 (UTC)
- では、見落としあるという前提で原則として太字からで集めましょう。別途節を設けます。--Open-box(会話) 2019年7月28日 (日) 01:31 (UTC)
進捗度表記について[編集]
リスト部分についての案を書いておきます。現在のリストはmetaとの照合用としての性格が強く、一般的な基準とは異なりますので英語版と{{CI}}を参考に考えたのですが、これぐらいでどうでしょうか。
: - 秀逸な記事 : - 良質な記事 : - 元秀逸な記事 : - 元良質な記事 : - A:30kバイト以上 : - B:10kバイト以上30kバイト未満 : - C:5kバイト以上10kバイト未満 : - スタート:2kバイト以上5kバイト未満 : - スタブ:2kバイト未満 : - 記事無し : - 現在リダイレクト
A/B/Cはmetaの3種類をそのままの数値で流用し、C以下をC/スタート/スタブに分けたものです。--Open-box(会話) 2019年7月2日 (火) 13:51 (UTC)
- スタートとスタブの追加に賛成します。バイト数はメタウィキのList of Wikipedias by sample of articlesで採用されている、英語の1.9倍とする基準を採用したいところですが、こちらはもう少しほかの方からの意見が欲しいところです。(英語の1.9倍という基準は、聖書のバベルの塔に関する記述の文字数比を由来としています。聖書を採用した理由はある程度の長さがあり、世界中の言語でおそらく最も多く翻訳されて、多くの言語で採用できるからです。1倍とした場合、英語版よりやや甘めの基準になりますが、他言語版との比較を重要視するかどうかで意見が分かれるでしょう。)--ネイ(会話) 2019年7月3日 (水) 12:49 (UTC)
- 文学的記述を適用できるのか以前に、それ実験してみましたけど変じゃないですか? Windowsのメモ帳でコピーして行頭の数字を削って確認したのですが、日本語が1,714バイト、英語が1,179バイトなので1.45。数値は多少前後するとしても、実際には言語差がないコード部分が入るので差はもっと少ないはずです。他言語を試していないのですが、1バイト文字前提の判断でGoogle翻訳に入れて文字数だけカウントしてると思われます。日本語の1978年版をコピーしてGoogle翻訳に入れると597ですし、行頭の数字が入ってしまうんです。一方英語の2002年版をコピーしても数字は入らない。これは恐らく他の言語でも同様のミスを侵していると思われます。倍率かけるなら補正入れて1.4ぐらいですが判りやすく45/30/15/7/3(スタートとスタブは半分にして切り捨て)ぐらいでしょうか。--Open-box(会話) 2019年7月3日 (水) 23:46 (UTC)
- コメントメタのは正確にはテンプレートやマークアップ等を除いた「文字数」なので1.9倍は文字をカウントして掛けないとだめです。この文書の「バイト数」は私が昔、統計的に求めた近似値なので正確には一致しません(それぞれの境界値の記事のバイト数を抽出して決めています)。バイト数ならすでにあるツールでちゃっちゃと調べられるので、まあ、そうしたのですけどね。メタに正確に合わせたかったらメタのコードをもとにツールを作ったほうがよいと思います。(聖書の文は「敬体」なので「常体」の百科事典の場合2.2倍ぐらいのほうがより正確ではありますが)--Afaz(会話) 2019年7月4日 (木) 00:08 (UTC)
- (被ったけどほとんどそのまま)Wikipediaなのでコード無視したらだめですね。さてどうしましょう。一応バベルの塔の日本語部分を再チェックしたのですがこれ、1162(英語)/598(日本語)=1.95でやってますね。日本語版の10K記事は英語版の19K記事に相当する? というのであれば30/20/10の判定を日本語版に移入するならA/B/C判定は逆に16K/12K/8Kになりますし、これが単純に記事サイズのみ減少している時点で式の運用がおかしいです。多分metaがやりたかったのは、各言語の記事サイズx英語版に直す比率→A/B/Cを英語版基準値で分析です。バイト的に違いがないイタリア語で1162/1078=1.07→切り上げて1.1。この基準をバイト数(日本語版から数値を削り解説は残したまま)でやると1179/1714=0.68→切り上げて0.7です。これなら実感に近い(小さい記事の翻訳時にサイズの増減が半減するほどではないどころか増えることもある)ですし、medianもこれに近い日→英が0.77なので、weightの計算がコピペミスかつバイト差の考察落ちで異常値になっていると考えます。--Open-box(会話) 2019年7月4日 (木) 00:29 (UTC)
- あ、medianが補正後の中央値と勝手に考えてましたが、これ単純な中央値? だとすると平均と比較しても無意味ですよね。--Open-box(会話) 2019年7月4日 (木) 01:06 (UTC)
- コメントメタのは正確にはテンプレートやマークアップ等を除いた「文字数」なので1.9倍は文字をカウントして掛けないとだめです。この文書の「バイト数」は私が昔、統計的に求めた近似値なので正確には一致しません(それぞれの境界値の記事のバイト数を抽出して決めています)。バイト数ならすでにあるツールでちゃっちゃと調べられるので、まあ、そうしたのですけどね。メタに正確に合わせたかったらメタのコードをもとにツールを作ったほうがよいと思います。(聖書の文は「敬体」なので「常体」の百科事典の場合2.2倍ぐらいのほうがより正確ではありますが)--Afaz(会話) 2019年7月4日 (木) 00:08 (UTC)
- 文学的記述を適用できるのか以前に、それ実験してみましたけど変じゃないですか? Windowsのメモ帳でコピーして行頭の数字を削って確認したのですが、日本語が1,714バイト、英語が1,179バイトなので1.45。数値は多少前後するとしても、実際には言語差がないコード部分が入るので差はもっと少ないはずです。他言語を試していないのですが、1バイト文字前提の判断でGoogle翻訳に入れて文字数だけカウントしてると思われます。日本語の1978年版をコピーしてGoogle翻訳に入れると597ですし、行頭の数字が入ってしまうんです。一方英語の2002年版をコピーしても数字は入らない。これは恐らく他の言語でも同様のミスを侵していると思われます。倍率かけるなら補正入れて1.4ぐらいですが判りやすく45/30/15/7/3(スタートとスタブは半分にして切り捨て)ぐらいでしょうか。--Open-box(会話) 2019年7月3日 (水) 23:46 (UTC)
- Afazさんの2.2倍案で検討しますとこうなります。220(英語)/100(日本語)=2.2。面倒なので制御コードを無視し、英語の空白、日本語の結合文字も無視します。すると日本語は1文字3バイトなのでバイト数に変換しますと220/300=0.733になりますので、聖書の場合と比較すると0.5ほど増加しています。日本語記事にはラテン文字表記、数字などが入るため差は縮まりますので、0.75から0.8でしょうか。0.8で24/16/8、0.78で23.4/15.6/7.8、0.75で22.5/15/7.5。こんなところの合意をとるのは面倒だから30/20/10でいいような気もします。--Open-box(会話) 2019年7月28日 (日) 01:31 (UTC)
十の項目を募集します[編集]
日本語版でも十の項目を運用するために案を募集します。最初に十の項目を日本語版で選ぶ参考として各言語版の項目を抽出しました。英語版の旧版の影響で、芸術の種類(芸術)・地球・世界の歴史・言語・生命・数学・哲学・科学・文化・テクノロジーのセットが多いのですが、当の英語版が文化とヒトを差し替えているようにこれに限定する必要はありません。原則として千の項目の太字から選択が行われる予定ですが、他言語版で頻出する世界の歴史は千の項目にすら入っていませんし、芸術の種類に至っては千の項目どころかこの文章を書いている時点で日本語版がありません。また、一部の言語版は言語と密接に関連する項目を選出しています。ですからあなたの考える十の項目としてよりふさわしいと考えるのであれば、範囲外から選択しても構いません。--Open-box(会話) 2019年7月28日 (日) 06:01 (UTC)
- 1週間以上経過して特にコメントがつかなかったため、当方から「芸術、歴史、文化、ヒト、言語、生命、地球、科学、数学、テクノロジー」の案を推してみます。千の項目の太字から選出する上で無難な選び方ではないかと思います。--ネイ(会話) 2019年8月7日 (水) 15:15 (UTC)
凡例は不用かどうか[編集]
分野別に分類していただき、とても使いやすいです。そこで分類後の子リストごとに凡例があると便利かと思いました。
以下、サンプルを試みましたのでご参照ください。Wikipedia:すべての言語版にあるべき項目の一覧/1万の項目より転写、たとえば「項目の数」の太字部分を除去、あるいは総数を指す項目をコメントアウトしました。 <!-- コメントアウト。*'''記事数''' - すでに記事のある項目。 -->
<!-- *'''作成率''' - 記事のある項目の割合。記事数/項目数×100 (%) -->
- 秀逸 - 秀逸な記事の項目。
- 良質 - 良質な記事の項目。
- A - 39,000バイト以上の記事。評価基準はWikipedia:すべての言語版にあるべき項目の一覧#How to use this list - この一覧を何に使うか参照。
- B - 13,000バイト以上39,000未満の記事。
- C - 13,000バイト未満の記事。
かえって煩雑になるかとも思ったのですが、携帯端末で親項目まで遡及したところ、なにを調べていたのかわからなくなってしまい、上記を思いつきました。もっとよくできる点を修正いただけるとありがたいです。 --Omotecho(会話) 2020年1月22日 (水) 14:30 (UTC)
Wikidataと異なる項目[編集]
英語版 - 言語間リンクによる日本語版 - このページに書かれた項目
- en:God - 唯一神 - 神
- en:Constitution - コンスティチューション (法学) - 憲法
- en:Mythology - 神話学 - 神話
- en:Nut (fruit) - 堅果 - 種実類
- en:Force - 力 (物理学) - 力
- en:Radioactive decay - 放射能 - 放射性崩壊
- en:Addiction - 嗜癖 - 依存症
- en:Algae - 藻類 - (なし)
- en:Epilepsy - てんかん - (なし)
- en:manufacturing - 製造業 - 産業
- en:Electromagnetic force - 電磁相互作用 - 電磁気学
- en:Electromagnetic radiation - 電磁放射線 - 電磁放射
リダイレクトになっている項目
- en:Great Barrier Reef - グレートバリアリーフ - グレート・バリア・リーフ
- en:Primate - 霊長目 - サル目
- en:Peter the Great - ピョートル1世 (ロシア皇帝) - ピョートル1世
- en:Ashoka - アショーカ - アショーカ王
- en:Alzheimer's disease - アルツハイマー病 - アルツハイマー型認知症
- en:Mental disorder - 精神障害 - 精神疾患
- en:Time zone - 等時帯 - 時間帯 (標準時)
- en:Sexually transmitted infection - 性感染症 - 性行為感染症
- en:Umm Kulthum - ウンム・クルスーム - ウム・クルスーム
--FlatLanguage(会話) 2024年3月7日 (木) 14:36 (UTC)
- 注釈付きで反映させました。--FlatLanguage(会話 / 投稿) 2024年4月14日 (日) 06:30 (UTC)