シンハラ文字 (Unicodeのブロック)
シンハラ文字 (Unicodeのブロック) | |
---|---|
Sinhala | |
範囲 |
U+0D80..U+0DFF (128 個の符号位置) |
面 | 基本多言語面 |
用字 | シンハラ文字 |
主な言語・文字体系 | |
割当済 | 90 個の符号位置 |
未使用 | 38 個の保留 |
Unicodeのバージョン履歴 | |
3.0 | 79 (+79) |
7.0 | 89 (+10) |
13.0 | 90 (+1) |
公式ページ | |
コード表 ∣ ウェブページ |
シンハラ文字(シンハラもじ、英語: Sinhala)は、Unicodeの32個目のブロック。
解説
[編集]インド洋に浮かぶ島国スリランカの公用語である、インド・ヨーロッパ語族インド・アーリア語派のシンハラ語の表記に用いられるシンハラ文字を収録している。
シンハラ文字はデーヴァナーガリーなどの他の多くの南アジアの文字体系と同様に、ブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では短母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加されるが、Unicodeにおいては子音字→母音記号の順に入力することとなっており、符号上の文字の置かれる順序と実際のレンダーにおける表示順とが入れ替わる場合がある。
また、デーヴァナーガリー同様頭子音を伴わない単独の母音にも子音字同様に独立した文字が充てられており、子音連続など子音のみで発音する場合は半子音字(英語: half-form)と呼ばれる形に変化したり、特殊な子音字同士の合字を形成したり、あるいは単に殺母音記号であるアル・ラクナ(al-lakuna)という記号を子音字の右上に付加したりする。
書字方向はラテン文字やキリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送り、単語毎に分かち書きをする。
子音字は有声音と無声音の弁別に加えて、有気音であるか無気音であるかを区別する。通常のブラーフミー系文字にあるこれらの区別に加えて、シンハラ文字には前鼻音化した有声破裂音にも独立した文字が割り当てられているため、各調音点における破裂音には計5種類の子音字が存在する。また、母音字については母音の長短によって文字が分けられている。
符号位置の順序はおおむね伝統的なブラーフミー系文字の順序に従っているが、インドの文字体系ではないため他のブラーフミー系文字と符号化の順序に互換性は無い。
加えて、アラビア文字やタイ文字などと同様に独自の数字体系(シンハラ数字)を有しているが、シンハラ文字においては占星術の記述に古典的に使用されたのみで、現在の通常の文章ではあまり用いられない。
Unicodeが登場する以前のシンハラ文字の文字コード規格であるSLS 1134やISO/IEC 10646-1:1993[1]などに由来する文字セットを元に、いくつかのUnicode Consortium宛の提案文書由来の拡張文字が加えられている。Unicodeのバージョン3.0で初めて追加された。
収録文字
[編集]「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(および一部はIAST)に従う。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
各種記号 | ||||
U+0D81 | ඁ | SINHALA SIGN CANDRABINDU | アヌナーシカ、或いはチャンドラビンドゥ。
母音字や母音記号に付き、母音を鼻母音で発音することを表す。 |
m̐ |
U+0D82 | ං | SINHALA SIGN ANUSVARAYA | アヌスヴァーラ、或いはビンドゥ。
直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。 |
ṁ |
U+0D83 | ඃ | SINHALA SIGN VISARGAYA | ヴィサルガ。
音節末に[h]を伴うことを表す。 |
ḥ |
独立母音字 | ||||
U+0D85 | අ | SINHALA LETTER AYANNA | 短母音[a]を表す。 | a |
U+0D86 | ආ | SINHALA LETTER AAYANNA | 長母音[aː]を表す。 | ā |
U+0D87 | ඇ | SINHALA LETTER AEYANNA | 短母音[æ]を表す。 | æ |
U+0D88 | ඈ | SINHALA LETTER AEEYANNA | 長母音[æː]を表す。 | ǣ |
U+0D89 | ඉ | SINHALA LETTER IYANNA | 短母音[i]を表す。 | i |
U+0D8A | ඊ | SINHALA LETTER IIYANNA | 長母音[iː]を表す。 | ī |
U+0D8B | උ | SINHALA LETTER UYANNA | 短母音[u]を表す。 | u |
U+0D8C | ඌ | SINHALA LETTER UUYANNA | 長母音[uː]を表す。 | ū |
U+0D8D | ඍ | SINHALA LETTER IRUYANNA | 音節主音化した短母音としてのR(IPA:[r̩])を表す。 | r̥[3] |
U+0D8E | ඎ | SINHALA LETTER IRUUYANNA | 音節主音化した長母音としてのR(IPA:[r̩ː])を表す。 | r̥̄[4] |
U+0D8F | ඏ | SINHALA LETTER ILUYANNA | 音節主音化した短母音としてのL(IPA:[l̩])を表す。 | l̥[5] |
U+0D90 | ඐ | SINHALA LETTER ILUUYANNA | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 | l̥̄[6] |
U+0D91 | එ | SINHALA LETTER EYANNA | 短母音[e]を表す。 | e |
U+0D92 | ඒ | SINHALA LETTER EEYANNA | 長母音[eː]を表す。 | ē |
U+0D93 | ඓ | SINHALA LETTER AIYANNA | 二重母音[aɪ]を表す。 | ai |
U+0D94 | ඔ | SINHALA LETTER OYANNA | 短母音[o]を表す。 | o |
U+0D95 | ඕ | SINHALA LETTER OOYANNA | 長母音[oː]を表す。 | ō |
U+0D96 | ඖ | SINHALA LETTER AUYANNA | 二重母音[aʊ]を表す。 | au |
子音字 | ||||
U+0D9A | ක | SINHALA LETTER ALPAPRAANA KAYANNA | 子音[k]を表す。 | k |
U+0D9B | ඛ | SINHALA LETTER MAHAAPRAANA KAYANNA | 子音[kʰ]を表す。 | kh |
U+0D9C | ග | SINHALA LETTER ALPAPRAANA GAYANNA | 子音[ɡ]を表す。 | g |
U+0D9D | ඝ | SINHALA LETTER MAHAAPRAANA GAYANNA | 子音[ɡʱ]を表す。 | gh |
U+0D9E | ඞ | SINHALA LETTER KANTAJA NAASIKYAYA | 子音[ŋ]を表す。 | ṅ |
U+0D9F | ඟ | SINHALA LETTER SANYAKA GAYANNA | 前鼻音化した子音[ᵑɡ]を表す。 | n̆g |
U+0DA0 | ච | SINHALA LETTER ALPAPRAANA CAYANNA | 子音[c]を表す。 | c |
U+0DA1 | ඡ | SINHALA LETTER MAHAAPRAANA CAYANNA | 子音[cʰ]を表す。 | ch |
U+0DA2 | ජ | SINHALA LETTER ALPAPRAANA JAYANNA | 子音[ɟ]を表す。 | j |
U+0DA3 | ඣ | SINHALA LETTER MAHAAPRAANA JAYANNA | 子音[ɟʱ]を表す。 | jh |
U+0DA4 | ඤ | SINHALA LETTER TAALUJA NAASIKYAYA | 子音[ɲ]を表す。 | ñ |
U+0DA5 | ඥ | SINHALA LETTER TAALUJA SANYOOGA NAAKSIKYAYA | 子音列[ɟɲ]を表す。 | jñ |
U+0DA6 | ඦ | SINHALA LETTER SANYAKA JAYANNA | 前鼻音化した子音[ⁿɟ]を表す。 | n̆j |
U+0DA7 | ට | SINHALA LETTER ALPAPRAANA TTAYANNA | 子音[ʈ]を表す。 | ṭ |
U+0DA8 | ඨ | SINHALA LETTER MAHAAPRAANA TTAYANNA | 子音[ʈʰ]を表す。 | ṭh |
U+0DA9 | ඩ | SINHALA LETTER ALPAPRAANA DDAYANNA | 子音[ɖ]を表す。 | ḍ |
U+0DAA | ඪ | SINHALA LETTER MAHAAPRAANA DDAYANNA | 子音[ɖʱ]を表す。 | ḍh |
U+0DAB | ණ | SINHALA LETTER MUURDHAJA NAYANNA | 子音[ɳ]を表す。 | ṇ |
U+0DAC | ඬ | SINHALA LETTER SANYAKA DDAYANNA | 前鼻音化した子音[ᶯɖ]を表す。 | n̆ḍ |
U+0DAD | ත | SINHALA LETTER ALPAPRAANA TAYANNA | 子音[t]を表す。 | t |
U+0DAE | ථ | SINHALA LETTER MAHAAPRAANA TAYANNA | 子音[tʰ]を表す。 | th |
U+0DAF | ද | SINHALA LETTER ALPAPRAANA DAYANNA | 子音[d]を表す。 | d |
U+0DB0 | ධ | SINHALA LETTER MAHAAPRAANA DAYANNA | 子音[dʱ]を表す。 | dh |
U+0DB1 | න | SINHALA LETTER DANTAJA NAYANNA | 子音[n]を表す。 | n |
U+0DB2 | (予約済) | ṉ | ||
U+0DB3 | ඳ | SINHALA LETTER SANYAKA DAYANNA | 前鼻音化した子音[ᶯd]を表す。 | n̆d |
U+0DB4 | ප | SINHALA LETTER ALPAPRAANA PAYANNA | 子音[p]を表す。 | p |
U+0DB5 | ඵ | SINHALA LETTER MAHAAPRAANA PAYANNA | 子音[pʰ]を表す。 | ph |
U+0DB6 | බ | SINHALA LETTER ALPAPRAANA BAYANNA | 子音[b]を表す。 | b |
U+0DB7 | භ | SINHALA LETTER MAHAAPRAANA BAYANNA | 子音[bʱ]を表す。 | bh |
U+0DB8 | ම | SINHALA LETTER MAYANNA | 子音[m]を表す。 | m |
U+0DB9 | ඹ | SINHALA LETTER AMBA BAYANNA | 前鼻音化した子音[ᵐb]を表す。 | m̆b |
U+0DBA | ය | SINHALA LETTER YAYANNA | 子音[j]を表す。 | y |
U+0DBB | ර | SINHALA LETTER RAYANNA | 子音[r]を表す。 | r |
U+0DBC | (予約済) | ṟ | ||
U+0DBD | ල | SINHALA LETTER DANTAJA LAYANNA | 子音[l]を表す。 | l |
U+0DBE | (予約済) | ḷ | ||
U+0DBF | (予約済) | ḻ | ||
U+0DC0 | ව | SINHALA LETTER VAYANNA | 子音[ʋ]を表す。 | v |
U+0DC1 | ශ | SINHALA LETTER TAALUJA SAYANNA | 子音[ɕ]を表す。 | ś |
U+0DC2 | ෂ | SINHALA LETTER MUURDHAJA SAYANNA | 子音[ʂ]を表す。 | ṣ |
U+0DC3 | ස | SINHALA LETTER DANTAJA SAYANNA | 子音[s]を表す。 | s |
U+0DC4 | හ | SINHALA LETTER HAYANNA | 子音[h]を表す。 | h |
U+0DC5 | ළ | SINHALA LETTER MUURDHAJA LAYANNA | 子音[ɭ]を表す。 | ḷ |
U+0DC6 | ෆ | SINHALA LETTER FAYANNA | 子音[f]を表す。 | f |
記号 | ||||
U+0DCA | ් | SINHALA SIGN AL-LAKUNA | アル・ラクナ(al-lakuna)[2]、或いはヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。
レンダー上は次の文字と繋がって合字を形成したり、半子音字形(half-form)と呼ばれる形状に変化する。文字によってはただ単にアル・ラクナ記号が子音字の上に書かれることもある。 |
|
従属母音記号 | ||||
U+0DCF | ා | SINHALA VOWEL SIGN AELA-PILLA | 長母音[aː]を表す。 | ā |
U+0DD0 | ැ | SINHALA VOWEL SIGN KETTI AEDA-PILLA | 短母音[æ]を表す。 | æ |
U+0DD1 | ෑ | SINHALA VOWEL SIGN DIGA AEDA-PILLA | 長母音[æː]を表す。 | ǣ |
U+0DD2 | ි | SINHALA VOWEL SIGN KETTI IS-PILLA | 短母音[i]を表す。 | i |
U+0DD3 | ී | SINHALA VOWEL SIGN DIGA IS-PILLA | 長母音[iː]を表す。 | ī |
U+0DD4 | ු | SINHALA VOWEL SIGN KETTI PAA-PILLA | 短母音[u]を表す。 | u |
U+0DD5 | (予約済) | |||
U+0DD6 | ූ | SINHALA VOWEL SIGN DIGA PAA-PILLA | 長母音[uː]を表す。 | ū |
U+0DD7 | (予約済) | |||
U+0DD8 | ෘ | SINHALA VOWEL SIGN GAETTA-PILLA | 音節主音化した短母音としてのR(IPA:[r̩])を表す。 | r̥[3] |
U+0DD9 | ෙ | SINHALA VOWEL SIGN KOMBUVA | 短母音[e]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。 |
e |
U+0DDA | ේ | SINHALA VOWEL SIGN DIGA KOMBUVA | 長母音[eː]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。 |
ē |
U+0DDB | ෛ | SINHALA VOWEL SIGN KOMBU DEKA | 二重母音[aɪ]を表す。
文字の左側にレンダーされるため、符号上の文字順序と表示上の順序とが入れ替わる。 |
ai |
2要素からなる従属母音記号 | ||||
U+0DDC | ො | SINHALA VOWEL SIGN KOMBUVA HAA AELA-PILLA | 短母音[o]を表す。 | o |
U+0DDD | ෝ | SINHALA VOWEL SIGN KOMBUVA HAA DIGA AELA-PILLA | 長母音[oː]を表す。 | ō |
U+0DDE | ෞ | SINHALA VOWEL SIGN KOMBUVA HAA GAYANUKITTA | 二重母音[aʊ]を表す。 | au |
従属母音記号 | ||||
U+0DDF | ෟ | SINHALA VOWEL SIGN GAYANUKITTA | 音節主音化した短母音としてのL(IPA:[l̩])を表す。 | l̥[5] |
占星術用数字 | ||||
U+0DE6 | ෦ | SINHALA LITH DIGIT ZERO | シンハラ文字における数字の0。
占星術の記述にかつて用いられた。 |
0 |
U+0DE7 | ෧ | SINHALA LITH DIGIT ONE | シンハラ文字における数字の1。
占星術の記述にかつて用いられた。 |
1 |
U+0DE8 | ෨ | SINHALA LITH DIGIT TWO | シンハラ文字における数字の2。
占星術の記述にかつて用いられた。 |
2 |
U+0DE9 | ෩ | SINHALA LITH DIGIT THREE | シンハラ文字における数字の3。
占星術の記述にかつて用いられた。 |
3 |
U+0DEA | ෪ | SINHALA LITH DIGIT FOUR | シンハラ文字における数字の4。
占星術の記述にかつて用いられた。 |
4 |
U+0DEB | ෫ | SINHALA LITH DIGIT FIVE | シンハラ文字における数字の5。
占星術の記述にかつて用いられた。 |
5 |
U+0DEC | ෬ | SINHALA LITH DIGIT SIX | シンハラ文字における数字の6。
占星術の記述にかつて用いられた。 |
6 |
U+0DED | ෭ | SINHALA LITH DIGIT SEVEN | シンハラ文字における数字の7。
占星術の記述にかつて用いられた。 |
7 |
U+0DEE | ෮ | SINHALA LITH DIGIT EIGHT | シンハラ文字における数字の8。
占星術の記述にかつて用いられた。 |
8 |
U+0DEF | ෯ | SINHALA LITH DIGIT NINE | シンハラ文字における数字の9。
占星術の記述にかつて用いられた。 |
9 |
追加の従属母音記号 | ||||
U+0DF2 | ෲ | SINHALA VOWEL SIGN DIGA GAETTA-PILLA | 音節主音化した長母音としてのR(IPA:[r̩ː])を表す。 | r̥̄[4] |
U+0DF3 | ෳ | SINHALA VOWEL SIGN DIGA GAYANUKITTA | 音節主音化した長母音としてのL(IPA:[l̩ː])を表す。 | l̥̄[6] |
約物 | ||||
U+0DF4 | ෴ | SINHALA PUNCTUATION KUNDDALIYA | テキストの終端を表す。 |
小分類
[編集]このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「記号」(Sign)、「従属母音記号」(Dependent vowel signs)、「2要素からなる母音記号」(Two-part dependent vowel signs)、「占星術用数字」(Astrological digits)、「追加の従属母音記号」(Additional dependent vowel signs)、「約物」(Punctuation)の9個となっている[2]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
[編集]この小分類にはシンハラ文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
[編集]この小分類にはシンハラ文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
[編集]この小分類にはシンハラ文字のうち、基本的な子音字が収録されている。子音字は何も母音記号が付かない場合は母音/-a/を伴って発音される。
記号(Sign)
[編集]この小分類にはシンハラ文字のうち、アル・ラクナ(al-lakuna)(殺母音記号)と呼ばれる、子音字の持つ母音/-a/を読まずに子音のみを発音することを表す記号1つのみが収録されている。この記号はレンダー上は子音字を半子音字形(half-form)に変形したり、後続する別の子音字と合字を形成するための制御文字として働くことが多い。ただし、文字によっては半子音字形を持たずただ単にハラントが子音字の上に付く場合もある。
従属母音記号(Dependent vowel signs)
[編集]この小分類にはシンハラ文字のうち、子音字に結合する母音記号が収録されている。組み合わせる先の子音字によっては特殊な合字を形成することがある。
2要素からなる母音記号(Two-part dependent vowel signs)
[編集]これらの母音記号には、子音の両側にグリフ部分があり、論理的な順序で子音に続くため、ほとんどの処理では 1 つの単位として扱われる。[2]
占星術用数字(Astrological digits)
[編集]これらの数字は、シンハラ・リス・イラカム(Sinhala Lith Illakkam)とも呼ばれ、主に占星術の記述に用いられた。この数字体系には、111E1-111F4 の範囲でエンコードされているシンハラ語の古典的な数字、シンハラ・イラカム(Sinhala Illakkam)とは異なり、0のプレースホルダーの概念がある。[2]
追加の従属母音記号(Additional dependent vowel signs)
[編集]この小分類にはシンハラ文字のうち、サンスクリット語に由来する音節主音化した長母音としての流音の母音記号が2つ収録されている。
約物(Punctuation)
[編集]この小分類にはシンハラ文字のうち、テキストの終端を表す約物(句読点)1文字のみが収録されている。
文字コード
[編集]シンハラ文字(Sinhala)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0D8x | ඁ | ං | ඃ | අ | ආ | ඇ | ඈ | ඉ | ඊ | උ | ඌ | ඍ | ඎ | ඏ | ||
U+0D9x | ඐ | එ | ඒ | ඓ | ඔ | ඕ | ඖ | ක | ඛ | ග | ඝ | ඞ | ඟ | |||
U+0DAx | ච | ඡ | ජ | ඣ | ඤ | ඥ | ඦ | ට | ඨ | ඩ | ඪ | ණ | ඬ | ත | ථ | ද |
U+0DBx | ධ | න | ඳ | ප | ඵ | බ | භ | ම | ඹ | ය | ර | ල | ||||
U+0DCx | ව | ශ | ෂ | ස | හ | ළ | ෆ | ් | ා | |||||||
U+0DDx | ැ | ෑ | ි | ී | ු | ූ | ෘ | ෙ | ේ | ෛ | ො | ෝ | ෞ | ෟ | ||
U+0DEx | ෦ | ෧ | ෨ | ෩ | ෪ | ෫ | ෬ | ෭ | ෮ | ෯ | ||||||
U+0DFx | ෲ | ෳ | ෴ | |||||||||||||
注釈
|
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
3.0 | 79 | L2/04-131 | Gihan Dias (15 April 2004), Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737) (英語) | |
7.0 | U+0DE6-0DEF | 10 | L2/07-002 | Michael Everson (12 January 2007), Proposal to add archaic numbers for Sinhala to the BMP (WG2 N3195) revised (英語) |
L2/08-007 | ICT / Sri Lanka (7 January 2008), Inclusion of archaic Sinhala numerals in the Sinhala character code range (英語) | |||
L2/08-068 | Gihan Dias (28 January 2008), Archaic Sinhala Numerals (英語) | |||
L2/10-165 | Gihan Dias (5 May 2010), Preliminary Proposal to Encode Sinhala Digits and Numerals (英語) | |||
L2/08-105 | Sri Lanka N.B. (5 February 2008), Observations on the Encoding of Archaic Sinhala Numerals in Unicode/UCS (英語) | |||
L2/10-301 | Ireland NB (9 August 2010), Proposal to add archaic numbers for Sinhala to the BMP and SMP (WG2 N3876) (英語) | |||
L2/10-312 | Gihan Dias (10 August 2010), Proposal to Encode Sinhala Archaic Numerals and Numbers (英語) | |||
L2/10-337 | SLSI (14 September 2010), Proposal to include Sinhala Numerals to the BMP and SMP (WG2 N3888) (英語) | |||
L2/10-433 | Harsha Wijayawardhana; Information and Communication Agency of Sri Lanka; SLSI (26 October 2010), Background information on the use of Sinhala Numerals (英語) | |||
13.0 | U+0D81 | 1 | L2/18-060 | Srinidhi A; Sridatta A (5 February 2018), Proposal to encode the CANDRABINDU for Sinhala (英語) |
L2/18-079 | Deborah Anderson (21 March 2018), Feedback on Sinhala candrabindu (L2/18-060) (英語) | |||
L2/20-137 | Gihan Dias (4 May 2020), Encoding of a character "Sinhala Chandrabindu" (英語) | |||
|
出典
[編集]- ^ Gihan Dias (2004年4月15日). “Sri Lanka standard: Sinhala character code for information interchange (draft for public comment, SLS 1134:2004, WG2-N2737)” (英語). Unicode. 2024年8月8日閲覧。
- ^ a b c d e "The Unicode Standard, Version 15.1 - U0D80.pdf" (PDF). The Unicode Standard (英語). 2024年8月8日閲覧。
- ^ a b IASTではṛと表記される。
- ^ a b IASTではṝと表記される。
- ^ a b IASTではḷと表記される。
- ^ a b IASTではḹと表記される。