統制語彙
表示
(優先語から転送)
統制語彙[1]:30 [2]:62(とうせいごい、英: controlled vocabularies)又は統制語[3]:716(とうせいご、英: controlled term; CT)とは、対象の情報群を用意した用語の集合に関連付けることで(情報群の)収拾・構造化及びその記述を図る[4]:443語彙体系である。
同義語や表記揺れがある自由語[3]:716(英: free term; FT)又は非統制語彙[5]と対比的に用いられる[6]。
概要
[編集]範列的曖昧性を次のような段階で制御できる[2]:63。
- 文法的変種の統制
- 表記揺れに対する優先語の設定
- 優先語間の階層構造等の構築
時折、第二段階(暗黙的に第一段階を包有する)だけを意識して、「表記揺れを統制した語彙」などと表現される[7]:x。
特徴
[編集]利点
[編集]- 検索漏れの防止
- 同義語や語形変化を統制してある[8]:3ので、表現の違いによる検索漏れを防ぐことができる[9]。
- 〝雑音〟の少ない検索結果
- (自由語による検索などとは異なり)文書の全内容を闇雲に探索するのではなく、文書作成者が意図的に選択、賦与した語彙による検索を主軸とする[10]為に、検索結果に目的としない余計な情報が混ざりにくくなる[9]。
- 網羅的検索[3]:718
問題点
[編集]- 作成者と利用者との乖離
- 作成者と利用者とが分断され、共通の言語ゲームに参加できない[11](2.1)。
- また、利用者が語彙の体系を理解しなくてはならない[8]:3 [注釈 1]。
- 非柔軟性
- 人工言語の一種である為、全ての概念を網羅できず[2]:63、また、語彙が古い言葉になりがちである[13][注釈 2](時勢からの遅れ[3]:718)。
- 階層構造以外の関連
- 特に図書館業界の統制語彙は、階層構造以外の観念間関連を表現する能力が弱く、より柔軟な関連表現が可能な (Web) オントロジーの手法に学ぶべきだという指摘もある[15]:437。
例
[編集]- 国立国会図書館典拠データ検索・提供サービス
- 国立国会図書館が提供する国立国会図書館件名標目表は典拠管理などに向けた汎用の統制語彙である[16]。
- ダブリンコアメタデータ
- ダブリンコアにおいては統制語彙の使用が最良慣行として推奨されている要素が多数ある[17]。
他体系との連関
[編集]自由語
[編集]統制語彙と対照をなす性質故に長短が逆転する自由語は、屡々統制語彙と適宜併用され[3]:716、 双方の利点を兼ね備えた〝折衷〟体系として実務に応用されている[18]。
特に統制語彙が苦手とする専門用語や新しい概念の索引として自由語が利用される傾向がある[19]。
民衆分類との連関
[編集]民衆分類は利用者が主体的に附加する語彙体系であり、 集合知の代表格と見做されている[20]:1217。 その民主性によって前述の乖離を解消すること等が期待されている[2]:66。
Webなど、タグ付けに統制語彙を用いるのが実際上又経済上の理由から困難である環境においては、 情報の整理・分類に、民衆分類が次善策として[注釈 3]用いられる[21]:240。
脚注
[編集]注釈
[編集]- ^ 統制語彙を作成する際は、想定される利用者に向けて、語彙の目的・対象について編纂者が意図を表明したり(作成方針)、語彙作成の経緯・手段についての具体的に記述する(作成方法)する必要がある[12]:828
- ^ 例えば、癩病は1996年頃からハンセン病と呼び換えれており、少なくとも1999年頃までには一般利用者から指摘がある[13]程度には改名後の名称が浸透していたが、国立国会図書館件名標目表において癩病がハンセン病に改名されたのは2003年になってからである[14]。
- ^ 民衆分類の使用が「次善」なのは、統制語彙の特徴であり利点である同義語・多義語の統制や階層化がほとんど行われていない[21]:240為である。
出典
[編集]- ^ JISX0701 2005.
- ^ a b c d 岸田 2007.
- ^ a b c d e 岡野 1990.
- ^ a b 武田 2011.
- ^ 畠山 et al. 1989.
- ^ 長屋 et al. 2011.
- ^ INPIT.
- ^ a b 常世田 2010.
- ^ a b 九大 2019.
- ^ 細野 1996.
- ^ 岸田 1998.
- ^ 山崎 et al. 1993.
- ^ a b ICU 1999.
- ^ NDLA 2017.
- ^ 渡邊 2011.
- ^ NDL.
- ^ DCMI 2012.
- ^ 西垣 1987.
- ^ 片岡, 志賀 & 園田 1984.
- ^ 大向 2006.
- ^ a b 緑川 2007.
参考文献
[編集]- 武田英明「Web時代の識別子と典拠を考える(<特集>典拠・識別子の可能性:ウェブ・オントロジーとの関わりの中で)」『情報の科学と技術』第61巻第11号、情報科学技術協会、2011年11月1日、441-446頁、doi:10.18919/jkg.61.11_441、2020年4月20日閲覧。
- 細野公男「索引作業の今日的特徴と課題(<特集>統制索引語に未来はあるか?)」『情報の科学と技術』第46巻第11号、情報科学技術協会、1996年11月1日、606-612頁、doi:10.18919/jkg.46.11_606、2020年4月20日閲覧。
- 岸田和明「インターネット時代における統制語彙の意義と役割(<特集>統制語彙・シソーラスの現在)」『情報の科学と技術』第57巻第2号、情報科学技術協会、2007年2月1日、62-67頁、doi:10.18919/jkg.57.2_62、2020年4月20日閲覧。
- 常世田 良「市民はコンテンツにたどりつけるのか?-検索技術・システム-」(PDF)『デジタル・ネットワーク社会における出版物の利活用の推進に関する懇談会/技術に関するワーキングチーム(第3回)』議事録、4巻、総務省、2010年4月27日。2019年9月20日閲覧。
- 岸田和明『情報検索の理論と技術』勁草書房、1998年10月。ISBN 978-4-326-04802-1。
- https://web.sfc.keio.ac.jp/~yofukami/y_fukami_master_thesis.pdf - p.26に岸田1998に掲載されている統制語と自由語の長所・短所
- 大向一輝「Web2.0の現在と展望 : 3.Web2.0と集合知」『情報処理』第47巻第11号、2006年11月15日、1214-1221頁、NCID AN00116625、NCID AN00116625、2020年4月20日閲覧。
- 山崎久道、高橋正美、原田智子、藤田節子、横山亮一、吉野敬子「ユーザーの視点からみたシソーラス評価の可能性(特集:インデクシングを考える)」『情報の科学と技術』第43巻第9号、一般社団法人 情報科学技術協会、1993年9月1日、824-842頁、doi:10.18919/jkg.43.9_824、2020年4月20日閲覧。
- 片岡彰博; 志賀泰司; 園田陽『昭和58年度 JOISユーザアンケート集』(レポート)1984年1月。
- 緑川信之「フォークソノミーの新奇性はどこにあるのか(<特集>図書館情報学の研究動向と新たな流れ)」『情報の科学と技術』第57巻第5号、一般社団法人 情報科学技術協会、2007年5月1日、238-243頁、doi:10.18919/jkg.57.5_238、2019年9月20日閲覧。
- 長屋俊、林豊、大谷周平、板橋慶造「統制語か自由語か?; ウェブで件名標目とシソーラスを利用するためのJavaScriptライブラリ」『Code4Lib Journal』第15巻、2011年10月、2019年9月11日閲覧。
- 畠山敦、川口久光、加藤寛次、藤澤浩道「自由語検索のための同義語・異表記展開方式」『全国大会講演論文集』第39巻ソフトウェア、1989年10月16日、1077頁、NCID AN00349328、2019年9月11日閲覧。
- 渡邊隆弘「典拠コントロールとオントロジー : 豊かな情報アクセスのための基盤(<特集>典拠・識別子の可能性:ウェブ・オントロジーとの関わりの中で)」『情報の科学と技術』第61巻第11号、2011年11月1日、434-440頁、doi:10.18919/jkg.61.11_434、2020年4月20日閲覧。
- 岡野弘行「これからの情報担当者 [第8回]」『情報管理』第33巻第8号、1990年、715-733頁、doi:10.1241/johokanri.33.715、2020年4月20日閲覧。
- 西垣 幸雄「内総合技術情報システム (SGJ) の構築」『情報科学技術研究集会発表論文集』第24巻、1987年10月、15-24頁。
- “Q&A 1999年分”. 国際基督教大学図書館 (1999年). 2019年9月11日閲覧。
- “シソーラス参照”. 九州大学附属図書館 (2019年9月19日). 2019年9月20日閲覧。
- 「おわりに/付属資料」『調査研究等の報告書』(レポート)独立行政法人工業所有権情報・研修館 。2019年9月11日閲覧。
- 例
- “Web NDL Authoritiesについて”. 国立国会図書館. 2019年9月20日閲覧。
- “DCMI Metadata Terms”. DCMI (Dublin Core Metadata Initiative) (2012年6月14日). 2019年9月20日閲覧。
- 規格
- JIS X 0701:2005「情報及びドキュメンテーション-用語」(日本産業標準調査会、経済産業省)
関連項目
[編集]外部リンク
[編集]- 特集=「統制語彙・シソーラスの現在」 - 統制語彙について日本語の文献様々
- Library Linked Data Incubator Group Final Report - 種々の統制語彙