コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

Template:Infobox gene/doc

遺伝子もしくはたんぱく質のページで使用されるテンプレートです。

使い方

[編集]
{{infobox_gene}}

とページの先頭に貼り付けると、ウィキデータからデータを取得して、自動で情報を整形して表示します。データはすべてウィキデータから読んでいるので、ウィキペディア上で入力するオプションなどはありません。

別のウィキデータのページの情報を呼び出して表示させたい場合は

{{#invoke:Infobox_gene|getTemplateData|QID=Q14860072}}

のようにします。ここで Q14860072ソニック・ヘッジホッグの遺伝子についてのウィキデータのページです。よってこのコードを使用すると、どこのウィキペディアのページからでも、ソニック・ヘッジホッグの情報を表示させることができます。

数値などを変更したい場合は、表示されたインフォボックス下部にある編集ボタンから、該当ページに飛んで編集してください。 ただし遺伝子およびたんぱく質に関するウィキデータ上の膨大な情報のほとんどは、ウィキデータ設立当初の2013年から2017年現在まで、英語版を中心とする現役の研究者たちがプロジェクトとして投稿・更新を行ってくれています。自分で直接編集するよりは、頼んで編集・修正してもらった方が、情報の形式の整合性などの点から考えれば、安全かもしれません。プロジェクトの中心となっているボット・アカウントはこちらです(→d:User:ProteinBoxBot

データの読み出し・変換・整形などの処理は、すべて Module:Infobox_gene が行っています。

仕組み

[編集]

簡単な仕組みの解説です。

「種」ごとに別ページ

[編集]

ウィキデータ上では、遺伝子の情報は「種」ごとに別々のページに保存されています。2017年現在、大量の情報が投稿されているのは「ヒト」と「マウス」のみです。ヒトは約2万の遺伝子を持つと言われますが、2017年現在、そのうち5割~6割程度の遺伝子について、独立したページがウィキデータに作成されています。その他いくつかのモデル生物に関しても、ごく少量ですが、遺伝子に関するページがウィキデータに作成されています。

これらの内、ウィキペディアにある遺伝子の記事と紐付けられているのは、「ヒト」に関する遺伝情報のページです。

たとえば「ピカチュリン」という記事がウィキペディアにあります。

このページと紐付けられているウィキデータ項目は d:Q18050476 です。これはヒトの持っているピカチュリン遺伝子についてのページです。

このウィキデータ項目の中にオーソログについて記録している「ortholog (P684)」という欄があります(縦長のページですが、真ん中ぐらいの所です)。ここで他の生物が持つピカチュリン遺伝子について記述したページへリンクが張られています。

ここを見ると、マウス(Mus musculus)が持っているピカチュリン遺伝子に関する情報は、d:Q18300872に保存されていることが分かります。(他にドブネズミC. elegansキイロショウジョウバエが持っているピカチュリン遺伝子のページへもリンクが張られています)

ここからヒトとマウスに関する遺伝子の情報を取り寄せ、それを一体にして整形して表示する、それがこのテンプレートの簡単な仕組みです。

「遺伝子」と「たんぱく質」で別ページ

[編集]

ウィキデータ上では、遺伝子の情報は「種」ごとに別々のページに保存されていることを上に書きましたが、実はさらに「遺伝子」と「たんぱく質」でも別ページに分かれています。

たとえば再び同じ例ですが、「ピカチュリン」についての、ヒト遺伝子の情報は ウィキデータ上では d:Q18050476 に保存されています。これは遺伝子に関するページです。

この遺伝子がコードしているたんぱく質については 「encodes(P688)」 という欄に情報が記述されています(上からちょっと降りた所です)。この欄を見ると d:Q335669へのリンクが張られています。このページはピカチュリンという「たんぱく質」に関する情報をまとめたページです。テンプレートで表示される遺伝子オントロジー系の情報は、こちらのたんぱく質のページの方に書かれていることが分かります。

一方、たんぱく質のページの方には、自分をコードしている遺伝子について記述している「encoded by(P702)」という欄があります。この「encoded by(P702)」の欄と、先ほどの「encodes(P688)」の欄を通して、遺伝子のページとたんぱく質のページが相互に接続されています。

これにより「たんぱく質」として立てられているページ(たとえばリーリン)においてこのテンプレートを使用しても、「encoded by(P702)」の欄に書かれている情報を参照して、自動で遺伝子のページを見つけて情報を取ってきて表示してくれる、という仕組みになっています。