コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

クメール文字 (Unicodeのブロック)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
クメール文字 (Unicodeのブロック)
Khmer
範囲 U+1780..U+17FF
(128 個の符号位置)
基本多言語面
用字 クメール文字
主な言語・文字体系
割当済 114 個の符号位置
未使用 14 個の保留
Unicodeのバージョン履歴
3.0 103 (+103)
4.0 114 (+11)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

クメール文字(クメールもじ、英語: Khmer)は、Unicodeの49個目のブロック

解説

[編集]

東南アジアの国カンボジアの公用語であるクメール語を表記するためのクメール文字を収録している。

クメール文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字に母音記号を付加することで発音を切り替えるアブギダに分類される。書字方向ラテン文字などと同様に左から右へ横書き(左横書き)する。原則分かち書きしない

母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されることがあるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。

子音字は元々有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別していた。そのため、各調音点における破裂音には計4種類の子音字が存在していた。現在は同じ調音点における有声音か無声音かの区別がなくなり(ただし元々反り舌音の無気音を表していた子音字が現在は有声音の[d]或いは入破音の[ɗ]を表している)、代わりに同じ母音記号がついても違う母音で発音されるという音韻規則によってa系(または第1音域, the first register)の子音とo系(または第2音域, the second register)の子音に分かれている。Unicodeでは文字名が-Aで終わっているか-Oで終わっているかでこれらの区別をしている。

また、子音字は子音クラスタを表す際に、U+17D2 KHMER SIGN COENGと結合して脚文字と呼ばれる別の子音字と結合するための特殊な形状に変化する。

加えて、アラビア文字やデーヴァナーガリーなどと同様に独自の数字体系(クメール数字)を有している。

符号位置の順序はおおむね伝統的なクメール文字の順序に従っている。

Unicodeのバージョン3.0において初めて追加された。

収録文字

[編集]

ラテン文字転写」の列はクメール文字のラテン文字への翻字方式の一つであるALA-LCに従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
子音字
U+1780 KHMER LETTER KA 子音[k]を表すa系子音字。 k
U+1781 KHMER LETTER KHA 子音[kʰ]を表すa系子音字。 kh
U+1782 KHMER LETTER KO 子音[k]を表すo系子音字。

元々は[ɡ]を表していた。

g
U+1783 KHMER LETTER KHO 子音[kʰ]を表すo系子音字。

元々は[ɡʱ]を表していた。

gh
U+1784 KHMER LETTER NGO 子音[ŋ]を表すo系子音字。 ng
U+1785 KHMER LETTER CA 子音[c]を表すa系子音字。 c
U+1786 KHMER LETTER CHA 子音[cʰ]を表すa系子音字。 ch
U+1787 KHMER LETTER CO 子音[c]を表すo系子音字。

元々は[ɟ]を表していた。

j
U+1788 KHMER LETTER CHO 子音[cʰ]を表すo系子音字。

元々は[ɟʱ]を表していた。

jh
U+1789 KHMER LETTER NYO 子音[ɲ]を表すo系子音字。 ñ
U+178A KHMER LETTER DA 子音[ɗ]を表すa系子音字。

元々は[ʈ]を表していた。

U+178B KHMER LETTER TTHA 子音[tʰ]を表すa系子音字。

元々は[ʈʰ]を表していた。

ṭh
U+178C KHMER LETTER DO 子音[ɗ]を表すo系子音字。

元々は[ɖ]を表していた。

U+178D KHMER LETTER TTHO 子音[tʰ]を表すo系子音字。

元々は[ɖʱ]を表していた。

ḍh
U+178E KHMER LETTER NNO 子音[n]を表すa系子音字。

元々は[ɳ]を表していた。 この文字は第1音域に属するので、正しい音訳はnnoではなくnnaである[1]。Unicodeの文字名は誤っている。

U+178F KHMER LETTER TA 子音[t]を表すa系子音字。 t
U+1790 KHMER LETTER THA 子音[tʰ]を表すa系子音字。 th
U+1791 KHMER LETTER TO 子音[t]を表すo系子音字。

元々は[d]を表していた。

d
U+1792 KHMER LETTER THO 子音[tʰ]を表すo系子音字。

元々は[dʱ]を表していた。

dh
U+1793 KHMER LETTER NO 子音[n]を表すo系子音字。 n
U+1794 KHMER LETTER BA 子音[ɓ]を表すa系子音字。

元々は[p]を表していた。

p
U+1795 KHMER LETTER PHA 子音[pʰ]を表すa系子音字。 ph
U+1796 KHMER LETTER PO 子音[p]を表すo系子音字。

元々は[b]を表していた。

b
U+1797 KHMER LETTER PHO 子音[pʰ]を表すo系子音字。

元々は[bʱ]を表していた。

bh
U+1798 KHMER LETTER MO 子音[m]を表すo系子音字。 m
U+1799 KHMER LETTER YO 子音[j]を表すo系子音字。 y
U+179A KHMER LETTER RO 子音[r]を表すo系子音字。 r
U+179B KHMER LETTER LO 子音[l]を表すo系子音字。 l
U+179C KHMER LETTER VO 子音[ʋ]を表すo系子音字。 v
U+179D KHMER LETTER SHA 子音[s]を表すa系子音字。

元々は[ɕ]を表していた。 パーリ語サンスクリット語の音訳にのみ用いられる[1]

ś
U+179E KHMER LETTER SSO 子音[s]を表すa系子音字。

元々は[ʂ]を表していた。 パーリ語サンスクリット語の音訳にのみ用いられる[1]

この文字は第1音域に属するので、正しい音訳はssoではなくssaである[1]。Unicodeの文字名は誤っている。

U+179F KHMER LETTER SA 子音[s]を表すa系子音字。 s
U+17A0 KHMER LETTER HA 子音[h]を表すa系子音字。 h
U+17A1 KHMER LETTER LA 子音[l]を表すa系子音字。

元々は[ɭ]を表していた。

U+17A2 KHMER LETTER QA 子音[ʔ]を表すa系子音字。 A
非推奨の翻字用独立母音字
U+17A3 KHMER INDEPENDENT VOWEL QAQ 元々パーリ語サンスクリット語における短母音[a]の翻字用に用意されていた。

この文字の使用は強く非推奨であり、代わりに17A2 អを用いることが推奨される[1]

a
U+17A4 KHMER INDEPENDENT VOWEL QAA 元々パーリ語サンスクリット語における長母音[aː]の翻字用に用意されていた。

この文字の使用は強く非推奨であり、代わりに文字列17A2 17B6 អាを用いることが推奨される[1]

ā
独立母音字
U+17A5 KHMER INDEPENDENT VOWEL QI 母音[ʔe]を表す。

元々短母音[i]を表していた。

i
U+17A6 KHMER INDEPENDENT VOWEL QII 母音[ʔəj]を表す。

元々長母音[iː]を表していた。

ī
U+17A7 KHMER INDEPENDENT VOWEL QU 母音[ʔo]を表す。

元々短母音[u]を表していた。

u
U+17A8 KHMER INDEPENDENT VOWEL QUK かつてU+17A7 1780 ឧក /uk/の合字として用いられていた[1]

現在は廃字となっており、通常のឧកという文字列の使用が推奨されている[1]

uk
U+17A9 KHMER INDEPENDENT VOWEL QUU 母音[ʔu]を表す。

元々長母音[uː]を表していた。

ū
U+17AA KHMER INDEPENDENT VOWEL QUUV 母音[ʔɨw]を表す。 ýu
U+17AB KHMER INDEPENDENT VOWEL RY 音節[ʔrɨ]を表す。

元々音節主音化した短母音としてのR(IPA:[r̩])を表していた。

U+17AC KHMER INDEPENDENT VOWEL RYY 音節[ʔrɨː]を表す。

元々音節主音化した長母音としてのR(IPA:[r̩ː])を表していた。

U+17AD KHMER INDEPENDENT VOWEL LY 音節[ʔlɨ]を表す。

元々音節主音化した短母音としてのR(IPA:[l̩])を表していた。

U+17AE KHMER INDEPENDENT VOWEL LYY 音節[ʔlɨː]を表す。

元々音節主音化した長母音としてのR(IPA:[l̩ː])を表していた。

U+17AF KHMER INDEPENDENT VOWEL QE 母音[ʔeː]を表す。

元々長母音[eː]を表していた。

ae
U+17B0 KHMER INDEPENDENT VOWEL QAI 母音[ʔaɪ]を表す。

元々二重母音[aɪ]を表していた。

ai
U+17B1 KHMER INDEPENDENT VOWEL QOO TYPE ONE 母音[ʔoː]を表す。

元々長母音[oː]を表していた。

o
U+17B2 KHMER INDEPENDENT VOWEL QOO TYPE TWO 母音[ʔoː]を表す。

元々長母音[oː]を表していた。 2つの単語のみで用いられるU+17B1 ឱの異体字[1]

o
U+17B3 KHMER INDEPENDENT VOWEL QAU 母音[ʔaʊ]を表す。

元々二重母音[aʊ]を表していた。

au
内在母音
U+17B4 KHMER VOWEL INHERENT AQ
U+17B5 KHMER VOWEL INHERENT AA
従属母音記号
U+17B6 KHMER VOWEL SIGN AA a系子音字では母音[aː]を、o系子音字では母音[iːə]を表す。 ā
U+17B7 KHMER VOWEL SIGN I a系子音字では母音[e]を、o系子音字では母音[ɨ]を表す。 i
U+17B8 KHMER VOWEL SIGN II a系子音字では母音[əɪ]を、o系子音字では母音[iː]を表す。 ī
U+17B9 KHMER VOWEL SIGN Y a系子音字では母音[ə]を、o系子音字では母音[ɨ]を表す。
U+17BA KHMER VOWEL SIGN YY a系子音字では母音[əːɨ]を、o系子音字では母音[ɨː]を表す。 ȳ
U+17BB KHMER VOWEL SIGN U a系子音字では母音[o]を、o系子音字では母音[u]を表す。 u
U+17BC KHMER VOWEL SIGN UU a系子音字では母音[oːʊ]を、o系子音字では母音[uː]を表す。 ū
U+17BD KHMER VOWEL SIGN UA a系子音字、o系子音字共に母音[uːə]を表す。 ua
2要素からなる従属母音記号
U+17BE KHMER VOWEL SIGN OE a系子音字では母音[aːə]を、o系子音字では母音[əː]を表す。 oe
U+17BF KHMER VOWEL SIGN YA a系子音字、o系子音字共に母音[ɨːə]を表す。 ẏa
U+17C0 KHMER VOWEL SIGN IE a系子音字、o系子音字共に母音[iːə]を表す。 ia
従属母音記号
U+17C1 KHMER VOWEL SIGN E a系子音字では母音[eːɪ]を、o系子音字では母音[eː]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

e
U+17C2 KHMER VOWEL SIGN AE a系子音字では母音[aːe]を、o系子音字では母音[ɛː]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

ae
U+17C3 KHMER VOWEL SIGN AI a系子音字では母音[aɪ]を、o系子音字では母音[ɨɪ]を表す。

文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。

ai
2要素からなる従属母音記号
U+17C4 KHMER VOWEL SIGN OO a系子音字では母音[aːo]を、o系子音字では母音[oː]を表す。 o
U+17C5 KHMER VOWEL SIGN AU a系子音字では母音[aʊ]を、o系子音字では母音[ɨʊ]を表す。 au
各種記号
U+17C6 KHMER SIGN NIKAHIT 音節末尾が鼻音化することを表す[1]。デーヴァナーガリーなどにおけるアヌスヴァーラに相当する。

現在は母音記号として扱われ[1]、a系子音字では母音[ɑm]を、o系子音字では母音[um]を表す。

U+17C7 KHMER SIGN REAHMUK ヴィサルガ

音節末に[h]を伴うことを表す。

現在は母音記号として扱われ、a系子音字では母音[aʰ]を、o系子音字では母音[eəʰ]を表す。

U+17C8 KHMER SIGN YUUKALEAPINTU 突然の声門破裂音を伴う固有の短母音を挿入する[1]

記号名について、本来は"yukaleakpintu"がより好ましい音訳である[1]

à
子音シフター
U+17C9 KHMER SIGN MUUSIKATOAN o系の子音字をa系子音字として読むことを表す[1]

記号名について、本来は"muusekatoan"がより好ましい音訳である[1]

U+17CA KHMER SIGN TRIISAP a系の子音字をo系子音字として読むことを表す[1]

記号名について、本来は"treisap"がより好ましい音訳である[1]

各種記号
U+17CB KHMER SIGN BANTOC 前の音節の母音を短くすることを表す[1]

記号名について、本来は"bantak"がより好ましい音訳である[1]

á
U+17CC KHMER SIGN ROBAT 歴史的にデーヴァナーガリー語のraのrepha形に相当する発音記号[1]

r+別の子音の子音クラスタで用いられる。

U+17CD KHMER SIGN TOANDAKHIAT 子音字の上に付き、語源の都合で書かれているが実際には発音されない黙字を表す記号[1]
U+17CE KHMER SIGN KAKABAT 感嘆を表す。感嘆符(!)に相当する。 !
U+17CF KHMER SIGN AHSDA 一部の単一子音語における強勢のあるイントネーションを表す[1]
U+17D0 KHMER SIGN SAMYOK SANNYA 発音の一般的な規則からの逸脱を示し、主にパーリ語/サンスクリット語フランス語などからの借用語で使用される[1]
U+17D1 KHMER SIGN VIRIAM ほとんど廃字となった殺母音記号。

基本文字が単語の最後の子音であり、その固有の母音音を持たないことを示す[1]

U+17D2 KHMER SIGN COENG 次のクメール文字を脚文字として表すことを示す制御文字[1]

表示される形状は任意であり、視覚的にレンダリングされない[1]

太陰暦用記号
U+17D3 KHMER SIGN BATHAMASAT もともと太陰暦における日付の記号の一部として意図されていた[1]

この文字の使用は推奨されず、代わりにクメール文字用記号ブロックに含まれる太陰暦の日付記号の完全なセットが使用される[1]

Various signs(の翻訳)
U+17D4 KHMER SIGN KHAN クメール文字における句点[1] .
U+17D5 KHMER SIGN BARIYOOSAN 節またはテキストの終わりを示す記号[1]
U+17D6 KHMER SIGN CAMNUC PII KUUH クメール文字におけるコロン(:)[1]

記号名について、本来は"camnoc pii kuuh"がより好ましい音訳である[1]

:
U+17D7 KHMER SIGN LEK TOO 直前の単語を2回繰り返して発音することを表す記号。日本語における「」などにあたる。
U+17D8 KHMER SIGN BEYYAL 「などなど(et cetera)」を表す単語の略記[1]

この文字の使用は推奨されない。他にも「et cetera」の省略形は存在する。代わりに文字列17D4 179B 17D4 ។ល។を用いることが推奨されている[1]

.l.
U+17D9 KHMER SIGN PHNAEK MUAN 本や論文の始まりを示す[1]

記号名について、本来は"phnek moan"がより好ましい音訳である[1]

U+17DA KHMER SIGN KOOMUUT 本や論文の終わりを示す[1]

U+17D9 ៙とペアで書かれる[1]。 記号名について、本来は"koomoot"がより好ましい音訳である[1]

通貨記号
U+17DB KHMER CURRENCY SYMBOL RIEL カンボジア・リエル通貨記号 KHR
各種記号
U+17DC KHMER SIGN AVAKRAHASANYA まれに、アポストロフィのように連音サンディ)によってサンスクリット語の語頭の母音 a が省略されていることを示す[1]

デーヴァナーガリーなどにおけるアヴァグラハ(U+093D ऽ)に相当する。 記号名について、本来は"avakraha sannya"がより好ましい音訳である[1]

'
U+17DD KHMER SIGN ATTHACAN 基本文字が、その固有の母音を持つ単語の最後の子音であることを示す記号[1]。ほぼ廃字となっている[1]
数字
U+17E0 KHMER DIGIT ZERO クメール文字における数字の0 0
U+17E1 KHMER DIGIT ONE クメール文字における数字の1 1
U+17E2 KHMER DIGIT TWO クメール文字における数字の2 2
U+17E3 KHMER DIGIT THREE クメール文字における数字の3 3
U+17E4 KHMER DIGIT FOUR クメール文字における数字の4 4
U+17E5 KHMER DIGIT FIVE クメール文字における数字の5 5
U+17E6 KHMER DIGIT SIX クメール文字における数字の6 6
U+17E7 KHMER DIGIT SEVEN クメール文字における数字の7 7
U+17E8 KHMER DIGIT EIGHT クメール文字における数字の8 8
U+17E9 KHMER DIGIT NINE クメール文字における数字の9 9
占いの伝承における数字記号
U+17F0 KHMER SYMBOL LEK ATTAK SON
U+17F1 KHMER SYMBOL LEK ATTAK MUOY
U+17F2 KHMER SYMBOL LEK ATTAK PII
U+17F3 KHMER SYMBOL LEK ATTAK BEI
U+17F4 KHMER SYMBOL LEK ATTAK BUON
U+17F5 KHMER SYMBOL LEK ATTAK PRAM
U+17F6 KHMER SYMBOL LEK ATTAK PRAM-MUOY
U+17F7 KHMER SYMBOL LEK ATTAK PRAM-PII
U+17F8 KHMER SYMBOL LEK ATTAK PRAM-BEI
U+17F9 KHMER SYMBOL LEK ATTAK PRAM-BUON

小分類

[編集]

このブロックの小分類は「子音字」(Consonants)、「非推奨の翻字用独立母音字」(Deprecated independent vowels for transliteration)、「独立母音字」(Independent vowels)、「内在母音」(Inherent vowels)、「従属母音記号」(Dependent vowel signs)、「2要素からなる従属母音記号」(Two-part dependent vowel signs)、「各種記号」(Various signs)、「子音シフター」(Consonant shifters)、「太陰暦用記号」(Lunar date sign)、「通貨記号」(Currency symbol)、「数字」(Digits)、「占いの伝承における数字記号」(Numeric symbols for divination lore)の12個となっている[1]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。

子音字(Consonants

[編集]

この小分類にはクメール文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合、a系子音字では母音[ɑ]、o系子音字では母音[ɔ]を伴って発音される。

非推奨の翻字用独立母音字(Deprecated independent vowels for transliteration

[編集]

これらのクローン化された独立母音は、もともとパーリ語サンスクリット語の音訳のためだけに意図されたものであった[1]。現在、使用は強く非推奨である。

独立母音字(Independent vowels

[編集]

この小分類にはクメール文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。

内在母音(Inherent vowels

[編集]

これらは音写のための不可視結合記号で、インド諸言語固有の母音とクメール語固有の母音を区別するためのものである。これらの文字は特定の用途との互換性のためだけに含まれており、他の文脈での使用は推奨されない[1]

従属母音記号(Dependent vowel signs

[編集]

この小分類にはクメール文字のうち、子音字に結合する母音記号が収録されている。

2要素からなる従属母音記号(Two-part dependent vowel signs

[編集]

これらの 2 分割従属母音符号は、子音の両側に立つグリフ部分を持っている。これらの母音記号は論理的な順序で子音に続くので、処理の際には一つの単位として扱われるべきである[1]

各種記号(Various signs

[編集]

この小分類にはクメール文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。

子音シフター(Consonant shifters

[編集]

この小分類にはクメール文字のうち、a系とo系の子音字をそれぞれ逆の系列の子音字として発音するための記号2種類が収録されている。

太陰暦用記号(Lunar date sign

[編集]

この小分類にはクメール文字のうち、もともと太陰暦における日付の記号の一部として意図されていた記号1つのみが収録されている。現在この文字の使用は推奨されず、代わりにクメール文字様記号ブロックに含まれる太陰暦の日付記号の完全なセットが使用される[1]

通貨記号(Currency symbol

[編集]

この小分類にはクメール文字のうち、カンボジア・リエル通貨記号1つのみが収録されている。

数字(Digits

[編集]

この小分類にはクメール文字で用いられる固有の数字が収録されている。

占いの伝承における数字記号(Numeric symbols for divination lore

[編集]

これらの文字はそれぞれ 0 ~ 9 の数値を持つが、計算には使用されない[1]

文字コード

[編集]
クメール文字(Khmer)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+178x
U+179x
U+17Ax
U+17Bx
U+17Cx
U+17Dx
U+17Ex
U+17Fx
注釈
1.^バージョン15.1時点


履歴

[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
3.0 U+1780..17DC,17E0..17E9 103 L2/01-372 Cambodia NB; SC2/WG2 N2380 (8 October 2001), Cambodian official objection to the existing Khmer block in UCS (英語)
L2/01-382 Maurice Bauhahn; Michael Everson (11 October 2001), Response to Cambodian official objection to Khmer block (N2380) (英語)
L2/02-073 Mark Davis (10 February 2002), Cambodian Thoughts (英語)
L2/02-083 Paul Nelson (11 February 2002), Response and Proposal for Khmer Encoding (英語)
L2/02-096 CHEA Sok Huor; LAO Kim Leang; HARADA Shiro; Norbert KLEIN (13 February 2002), Proposal to encode Khmer subscript characters (英語)
L2/02-097 CHEA Sok Huor; LAO Kim Leang; HARADA Shiro; Norbert KLEIN (13 February 2002), Proposal to deprecate Khmer characters (英語)
L2/02-131 Michael Everson (31 March 2002), On the suitability of the COENG encoding model for Khmer (英語)
L2/02-196 Harada; Cambodia NB (3 May 2002), On the Unsuitability of Coeng Model for Khmer (英語)
L2/02-211 Cambodia (14 May 2002), Cambodian stance regarding Khmer code table in Unicode 3.2 (英語)
L2/03-430 Mark Davis (24 November 2003), Problem with Khmer / ZWJ / ZWNJ (英語)
4.0 U+17DD 1 L2/02-100 CHEA Sok Huor; LAO Kim Leang; HARADA Shiro; Norbert KLEIN (13 February 2002), Proposal to add missing Khmer characters (英語)
U+17F0..17F9 10
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

[編集]
  1. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw "The Unicode Standard, Version 15.1 - U1780.pdf" (PDF). The Unicode Standard (英語). 2024年10月14日閲覧

関連項目

[編集]