語彙の共通度
表示
語彙の共通度(ごいのきょうつうど、lexical similarity)は、ある二つの言語また方言の語彙のうち同じ単語が用いられる比率。二つの言語の語彙が全て同じ場合を1(100%)とし、語彙が全て異なる場合を0(0%)とする。その数値は、比較のために抽出される単語や、一致するとみなす基準によって異なった結果になる。語彙の共通度が高いほど、二つの言語の話者どうしの相互理解も容易になるが、語彙以外に音韻・形態・統語も相互理解の容易さを決定する大きな要素であるため、英語とフランス語のように、語彙だけ共通する部分が多くても相互理解可能性(mutual intelligibility)は高くない。
エスノローグによる語彙の共通度
[編集]下はエスノローグの算出による語彙の共通度の表である(とエズグロット)。[1]
Lang. code |
言語1 ↓ |
比率 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
cat | カタルーニャ語 | 1 | ||||||||||
eng | 英語 | - | 1 | |||||||||
fra | フランス語 | - | 0.27 | 1 | ||||||||
deu | ドイツ語 | - | 0.60 | 0.29 | 1 | |||||||
ita | イタリア語 | 0.87 | - | 0.89 | - | 1 | ||||||
por | ポルトガル語 | 0.85 | - | 0.75 | - | - | 1 | |||||
ron | ルーマニア語 | 0.73 | - | 0.75 | - | 0.77 | 0.72 | 1 | ||||
roh | ロマンシュ語 | 0.76 | - | 0.78 | - | 0.78 | 0.74 | 0.72 | 1 | |||
rus | ロシア語 | - | 0.24 | - | - | - | - | - | - | 1 | ||
srd | サルディーニャ語 | 0.75 | - | 0.80 | - | 0.85 | - | - | 0.74 | - | 1 | |
spa | スペイン語 | 0.85 | - | 0.75 | - | 0.82 | 0.89 | 0.71 | 0.74 | - | 0.76 | 1 |
言語2 → | cat | eng | fra | deu | ita | por | ron | roh | rus | srd | spa |
Notes:
- L言語コードは ISO 639-3による
- サルディーニャ語については明確に計算されていない。
- "-" はデータが存在しないことを表す。
注
[編集]参照
[編集]- Ethnologue.com (lexical similarity values available at some of the individual language entries)
- Definition of lexical similarity at Ethnologue.com
- Rensch, Calvin R. 1992. "Calculating lexical similarity." In Eugene H. Casad (ed.), Windows on bilingualism , 13-15. (Summer Institute of Linguistics and the University of Texas at Arlington Publications in Linguistics, 110). Dallas: Summer Institute of Linguistics and the University of Texas at Arlington.