コンテンツにスキップ

利用者‐会話:Doraemonplus/新カテゴリページUI案

ページのコンテンツが他言語でサポートされていません。

「部分カテゴリ」について

関連性を実装した場合のUIの例示、どうもありがとうございます。イメージが掴みやすくなり、非常に素晴らしい仕事と思います。 その上でですが、ここで書かれている部分カテゴリは実際のところ、すべて関連カテゴリに分類されるべき内容と思います。

  • 学群 … 学群は大学そのものではありません。組織運営上、各学群が各大学に所属しているだけで、実体としては「教育のコース」です。
  • 学部、大学の学科、大学の研究室 … 学部・学科・研究室は大学そのものではありません。組織運営上、各学部・学科・研究室が各大学に所属しているだけで、実体としては教授らにとっての「組織」であり学生にとっての「教育のコース」です。
  • キャンパス … キャンパスは大学そのものではありません。組織運営上・地理的に・および土地の権利として、各キャンパスが各大学に所属しているだけで、実体としては「キャンパス」です。(これは独自研究になるかも知れませんが、会社の「事業所」「拠点」などと等価な存在だと思います)
  • 大学出版局 、大学図書館、大学博物館 … 出版局、図書館、博物館は大学そのものではありません。組織運営上、各大学出版局・図書館・博物館が各大学に所属しているだけで、実体としては「組織」であり「出版局」「図書館」「博物館」です。
  • 大学別の人物 … 人物は大学ではありません。組織運営上、各人物が各大学に所属しているだけで、実体としては「人物」です。

これがクラス・テーマを分類しなければならない現在のカテゴリの方針の難しいところだと思います。「Category:大学」の子・孫…にはどこまで行っても「○○大学」しかあってはいけないので。学部・学科・キャンパス・出版局・図書館…などは実際に大学の下部組織であり、特に判断が難しいかも知れないのですが、これらは「大学」ではないです。「人物」で考えると解りやすいと思います。

同じような話が、私の主に活動している言語学関連でもありまして…。

  • 語族 > ○○語族 > △△語派 > ◇◇語群 … □□語群 > ●●語 というカテゴリ・記事だけの分類にすべきなのに、「Category:ゲルマン語派」の下に「Category:ゲルマン語の姓」がある。これは「テーマ:ゲルマン語派」で実体の分類としては「名前 > 人名 > 」とかになる認識

などです。

--Bit会話2024年3月23日 (土) 14:40 (UTC)[返信]

すみません、判断基準を示していませんでした。判断基準は「集合と要素の関係かどうか」です。以下の図を参照ください。
集合「大学」は、要素「●●大学」、要素「○○大学」…を集めたグループなので、それ以外は入りません。各学部は代わりに集合「学部」に入ります。各大学の○○学部は、集合「○○学部」に入ります。以下の図を参照ください。
--Bit会話2024年3月24日 (日) 17:08 (UTC)[返信]
ありがとうございます。図解で説明していただき、たいへん分かりやすいです。部分カテゴリについては、様々な見方ができると思います。私は「大学」を構成する一部分として「学部」「キャンパス」「附属機関」「人物」を位置づけましたが、なるほど、Bitさんのお考えも理解できます。別の例で説明すると、人体の中に人体の部位など)が「部分カテゴリ」として含まれるイメージです。
現行のカテゴリの技術仕様では、Objekt/Set/クラスカテゴリおよびThemen/Topic/テーマカテゴリの区別が、表現可能な知識組織化の限界かもしれません。前者は「集合と要素の関係」が基本、後者は「件名と話題の関係」が基本で、これに「全体と部分の関係」が加わります。利用者がCategory:大学にどのような内容を期待するか次第で、いずれの用途も有効な使用法ですが、三者を区別する仕組みを持たないまま、「カテゴリ」として一緒くたに実装してしまったのが、結果的に不合理を招き、ウィキペディアの大規模化とともにカテゴリ仕様の問題が顕在化した形です。
ドイツ語版では、de:Kategorie:Universitätをクラスカテゴリ、de:Kategorie:Universitätswesenをテーマカテゴリとして整理整頓を試みていますが、この "wesen" が曲者でして、無理に翻訳しようとすると、「大学制」のような、カテゴリ名として不自然な日本語となってしまいます。他方で、de:Kategorie:Staatde:Kategorie:Staatenのように単数形と複数形で区別する方法も、無理に「国々」「諸国」と翻訳すると、ニュアンスが大きく変化してしまいます。このように、印欧語漢語系語の間には越えられない壁があり、クラスとテーマによる区別も限界にきています。
カテゴリ名は「大学」のまま、上述した三者の関係性をカテゴリーカテゴリ間とカテゴリー記事間について適用できるように仕様変更すれば、この問題は概ね解決できるものと私は信じています。おそらく中国語や朝鮮語などでも同様の問題はあるだろうと思うので、カテゴリ事情をよく調査して、漢字圏の言語版のコミュニティの要望として、連携して提案すれば、より実現する見込みの高い、実効力のある提案となるでしょう。--Doraemonplus会話2024年4月4日 (木) 11:16 (UTC)[返信]
コメントありがとうございます。ご指摘の通り、全体-部分の関係性が実態として存在していますね。人体の部位の例は私も考えながら書いていました。
以下のように関係性のデータ記述子英語版を使い分けることで実現は可能と思います。
  • 集合-要素:memberof, belongto, 一員, 所属…
  • 全体-部分:partof, consistof, 構成, 構成要素…
  • 関連:relatedto, 関連…
一方で、3種類の概念/記述子の使い分けという複雑な作業を、各編集者がやり切れるかという問題もあると思います。
  • 2種類であれば、編集者は「Aか、Aでないか」だけの判断をすれば良く、比較的簡単な作業で済みます。
  • 3種類だと「Aか、Bか、AでもBでもないか」の判断をする必要があり、難易度は一気に上がります。
  • また、現状でも「クラスかテーマか」「Set or Topic」「Objekt oder Themen」という二項対立までは、WP:カテゴリの方針でお膳立てされており、これを参考に使い分けることができます。集合-要素と全体-部分を区別する場合、その指針が利用できないのが痛いです。
  • ただ一方で、私が例に挙げた記述子は自然言語に近いため、実は判断の難易度は高くない…かという可能性もあります。どちらかというとシステム側が区別して表示するかしないかだけの問題かも知れません。
  • 余談ですが、現在問題になっている孫以降の抱合関係の完全性の話からすると、本質は「クラスかテーマか」ではなく、「クラスであるかクラスでないか」なのではないかと思っています。それでクラスとは何かを突き詰めていったら集合-要素に行きつきました。オブジェクト指向プログラミングでいうクラス-インスタンスを想像すると更に理解しやすいかも知れません。
--Bit会話2024年4月4日 (木) 15:32 (UTC)[返信]
Bitさん このところ現実世界で忙しく、間が空いてしまい、申し訳ないです。
  • 本質は「クラスであるかクラスでないか」という見方に同意です。クラスでない場合、それは自動的にテーマであるとみなせます。
  • 日本語版ウィキペディアの場合、Wikipedia:カテゴリの方針#カテゴリとはにおいて、カテゴリは第一義として「分類」(=クラス)を表すとされていますが、2024年現在、(カテゴリ:大学を見てもわかるように)実態的には「テーマ」を表すカテゴリが全体の大部分を占めています。ここで仮に instanceof: なり memberof: なりを用いてクラス/非クラスを区別する場合、通常の Category: はデフォルト(既定)でテーマを表し、instanceof: や memberof: の指定でクラスを表すことになるかと思います。少なくとも現状の日本語版に合わせると、従来の Category: のデフォルト設定はテーマとするのが最適です(この場合、現行のカテゴリの方針は改定が必要です)。
  • 一方、ドイツ語版では、de:Kategorie:Universitätなどの例からも窺えるように、全体としてクラス主体のカテゴリ体系となっています。この場合、クラスを Kategorie: のデフォルト設定とするのが最適であると考えられます。英語版や日本語版とは正反対です。
  • このように、言語によってカテゴリの運用方針が異なるため、むしろクラスのほうをデフォルトにして subjectof: や topicof: でテーマ/非テーマを識別可能とする選択肢も用意できると、言語の多様性に配慮した、より柔軟な運用が可能になると思います。それだけシステムの仕様は複雑になりますが、現行のカテゴリ体系からの円滑な移行を考慮すると、推して残すべき選択肢ではないかと思います。
  • 全体-部分関係に関しては、テーマ(連想関係)として扱うことも一つの解法であると思うので、シンプルさを求めるなら、これは無理に定義しなくてよいかもしれません(クラスやテーマに比べると、需要が少なそう)。
  • 以上はカテゴリ-記事の関係性の話で、カテゴリ-カテゴリの関係性については、同じ instanceof: でも別の視点で見る必要があります。というのも、東京大学に instance:大学 を付与するのと、東京大学に instance:大学 を付与するのでは、カテゴリの中身がまるで違うためです。この問題に関しては追々。ひとまず、ここで筆をおきます。
--Doraemonplus会話2024年4月17日 (水) 14:22 (UTC)[返信]
頭出しのところだけして、フォローアップがあまりできていませんでした。
上述の「孫以降の抱合関係の完全性」(カテゴリの親子関係に推移律(A→BかつB→CならA→Cと考えてよいか)が成り立つか否か)を議論する際に考える必要があるのが複合カテゴリの扱いです。
クラスのカテゴリに制約をつける形で分割していくものについては、利用者:Doraemonplus/新カテゴリページUI案で+に分類されているように、推移律が成り立つ関係としてよいと思います。一方、制約に使われる側もサブカテゴリとして扱われています。例えば、東京大学東京大学の人物の関係です。テーマとしては、関連しているとも考えられますが、例えば、1969年1969年生のように、かなり関係性の薄いものまで含まれることになるかと思います。
全体を整理するためには、この複合カテゴリの扱いについても、大まかな方針を決めた萌芽良いのではないかと思いました。--Wcontology会話2024年4月19日 (金) 10:54 (UTC)[返信]
ご意見ありがとうございます。もう一つ、カテゴリの親子関係に関して悩ましい問題は、提案中の新方式で導入される、内容が半クラス半テーマのカテゴリ同士のカテゴリ-カテゴリ関係です。例として、Category:大学には、集合-要素関係にある大学記事のほか、テーマ-トピック関係にある人物その他の記事も含まれます。このとき、同カテゴリを集合関係に従ってCategory:高等教育機関の下位カテゴリとすると、大学記事に対しては集合関係が満足しますが、人物その他の記事に対しては満足しません。テーマ関係としては間違ってはいませんが、人物記事の親クラスは、Category:教育機関別の人物でなければならないはずです。カテゴリ-記事の関係性をinstanceofで厳密に定義したとしても、カテゴリ名のオントロジー関係ではなく、カテゴリが内容として含む記事の集合を基準にして、カテゴリ-カテゴリ関係の推移律を保つのは困難であるように思われます。何か別の解決策がないものかと思案し始めています。--Doraemonplus会話2024年4月20日 (土) 06:51 (UTC)[返信]
Doraemonplusさん、Wcontologyさんへの返信にあるように、新方式に於いては、教育機関そのものの下位(クラス)カテゴリに、そこで働く人物のカテゴリやそこの出身人物のカテゴリを含めることが誤りとなります。ご指摘のようにCategory:人物 -> Category:教育機関別の人物 やもう少し細分化されたカテゴリに対し、memberofでクラス指定するのが正しく、Category:大学に対してmemberofでクラス指定をしてはいけません。Category:大学に対しては該当カテゴリはrelatedtoでテーマ指定をできるのみです。このイメージで考えれば解決になるのでないかと考えるのですが、いかがでしょうか?--Bit会話2024年5月7日 (火) 17:51 (UTC)[返信]
@Bitさん 上述したのは、どちらかというとCategory:大学の上位カテゴリとの親子関係に関する問題といえます。
relatedto:で関連付けるにせよ、Category:大学の下には、大学受験とかCategory:大学で起きた事件といった、テーマ-トピック関係にある記事やカテゴリが、関連カテゴリ関連するトピックとして、無視できない数、含まれることになります。ここで仮にCategory:高等教育機関Category:大学の親カテゴリとした場合、前記のトピック項目群に対して、見かけ上、誤った分類となってしまいます(受験・事件≠教育機関)。
無論、内部的には、集合-要素関係はinstanceof:/memberof:で、テーマ-トピック関係はrelatedto:/topicof:で、各々区別されるわけですが、一つのCategory:として見たとき、その内容は両方を半々に含んでいるので、親カテゴリとの関係性をいずれか一意には定め難いです。
下手にデータ記述子を導入するとカテゴライズが煩雑になり、カテゴリを容易には取り扱えなくなることが予想されます。現にBitさんに個別対応でこれだけ丁寧にご説明いただいたにもかかわらず、未だ「イメージ」の共有すらできていません。このような状況では、不特定多数の利用者に記述子を正しく理解し、適切に取り扱っていただくことは、到底無理なのではないかと思います。より仕組みが単純な「クラス系のカテゴリとテーマ系のカテゴリを完全に別の名前空間に分離してしまう方法」を再検討してみようかと考え始めています。--Doraemonplus会話2024年5月12日 (日) 01:11 (UTC)[返信]
Wcontologyさん、ご指摘の通りで、複合カテゴリが大半を占めている現状を打開するための策として現状の提案をしておりますので、ここに関してはイメージはできています。Category:東京大学の人物へは、「Category:memberof:人物」「Category:relatedto:東京大学」をそれぞれ付与すべきで、Category:1969年生へは、「Category:memberof:人物」「Category:relatedto:1969年」をそれぞれ付与すべきと考えています。--Bit会話2024年5月7日 (火) 17:37 (UTC)[返信]
そこまでバラバラにしてしまうと、例えば、生年と没年の区別がつかなくなります.生年<没年という別の知識を使わないといけなくなり、利便性が落ちます.
本来、このようなカテゴリは、DBpediaやWikidataなどのメタデータを使って、一貫してつけた方が望ましいと考えています.昔の試みですが、
WC3(WC-triple):Wikipedia Category Comprehensiveness Checker (DBpedia 2016-10 version)
と言うツールを作っていました.これは、DBpediaのメタデータを使って、カテゴリを表すのに適切なSPARQLクエリを作成し、実際のカテゴリに属するページと比較して、カテゴリの付け忘れやつけ間違いを発見しようというツールとなります.古いツールなので、httpのままです。すいません。
デモや論文へのリンクもありますが、簡単な機能の一部の説明です
英語版と古いDBpediaの組み合わせになりますが、1991 birthsというカテゴリについて検索し、その結果から間違いの候補を探すというシステムの結果に、以下でアクセスできます.
http://wnews.ist.hokudai.ac.jp/wc3?utf8=%E2%9C%93&search=1991+births&checkError=1
結果の中から、
Category pages that are not retrieved by the query
を選択すると、カテゴリが付与されているのに検索されない(メタデータがないもしくはカテゴリが誤って付与されている)ものがリストされます.この中の、Adam_Jezierskiについては、1990 birthsが候補としてしめされています.実際にページを見ると、infoboxの情報とカテゴリの情報が矛盾しています.
この手の複合カテゴリの多くは、メタデータを用いた自動付与の枠組でメンテナンスすると、ユーザはこれまでどおりの利用が出来ますし、メタデータ(DBpediaを使うなら主にinfoboxだが、現在ならWikidataを中心にする方が良いかもしれない)を入力するためのモティベーションにもなるのかもしれないと思っています.
ただ、当時も今もこのツールへの反響はあまりありませんが、今回の議論には参考になるかと思い、紹介させていただきました.--Wcontology会話2024年5月8日 (水) 01:39 (UTC)[返信]
Doraemonplusさん、お忙しい中のコメントどうもありがとうございます。私の方も遅くなりすみません。
いくつかの言語版での分類・テーマの傾向をありがとうございます。Cetegory付与時のmemberof/relatedto等の記述子について、まず「指定必須」「指定は任意」の選択肢があり、更に無指定時に「クラスにする」「テーマにする」の初期値の選択肢が有りうると考えます。
  • 記述子の指定必須
  • 記述子の指定は任意 - 無指定時の初期値はクラス
  • 記述子の指定は任意 - 無指定時の初期値はテーマ
そしてこの値は言語ごとに設定できるのが便利であり、実装の手間もそんなに大きくないと考えられるので、推して残すべしとのご意見に賛同します。
一方でカテゴリの方針の文面「カテゴリは第一義を○○とする」と、システムの運用の都合上決める初期値は、必ずしも一致していなくても良いかなと考えています。ただ、いずれにしても新システム導入時に見直すべき箇所はあり(件名カテゴリの記述など)、改定は必須との認識です。--Bit会話2024年5月7日 (火) 17:25 (UTC)[返信]
後半部分、ドイツ語版に関する知見、どうもありがとうございます。Doraemonplusさんのドイツ語の理解がどの程度なのか判りませんが、wesenを付けるようなやり方がドイツ語母語話者にとってどの程度自然に感じられるのかも興味があります。もしかしたら母語話者から見ても日本語直訳の「大学制」と同じように不自然さを感じている可能性もあるのかな…と思いました。私は英語だけは仕事で使いますが、確かに英語で複数形を集合/クラス/Setとするのは自然な表現だとは感じています。ドイツ語の単数形も同じように自然な感じなのかどうなのか…。
どういうことかというと、もしかしたら印欧語でも多少の不自然さはあり、無理やり妥協して運用しているのでは…?今回の日本語版からの提案は、印欧語版でも最適化となり歓迎される可能性があるのでは…?と考えた次第です。--Bit会話2024年4月4日 (木) 15:46 (UTC)[返信]