コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

タイ文字 (Unicodeのブロック)

出典: フリー百科事典『ウィキペディア(Wikipedia)』
タイ文字 (Unicodeのブロック)
Thai
範囲 U+0E00..U+0E7F
(128 個の符号位置)
基本多言語面
用字 タイ文字
主な言語・文字体系
割当済 87 個の符号位置
未使用 41 個の保留
Unicodeのバージョン履歴
1.0.0 87 (+87)
公式ページ
コード表 ∣ ウェブページ
テンプレートを表示

タイ文字(タイもじ、英語: Thai)は、Unicodeの33個目のブロック

解説

[編集]

東南アジアタイ王国の公用語であるタイ語やその方言を表記するためのタイ文字を収録している。

タイ文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字に母音記号を付加することで発音を切り替えるアブギダに分類される。

母音記号はものによっては文字の左側に付けられたり、子音字を左右から挟む形で付加される。なお、このような母音記号は多くのブラーフミー系文字では実際の発音の順序に合わせてレンダー位置が入れ替わることが多いが、タイ文字については文字が書かれる順序通りに入力することとなっている。

デーヴァナーガリー文字などのインドの文字とは異なり、頭子音のない独立した母音を表す文字が存在しない。代わりに頭子音のない母音を表す場合は無子音、あるいは声門破裂音[ʔ]を表す子音字オー・アーン(U+0E2D อ)を用いて表現する。また、子音連続は単に子音字を連続して書くことで表され、南アジアの文字体系で用いられるヴィラーマのような記号は通常は使われない(例外的にパーリ語の音訳においては似たような記号が用いられる。U+0E3A THAI CHARACTER PHINTHUを参照)。

書字方向ラテン文字キリル文字などと同様に左から右へと横書き(左横書き)し、下に行を送る。分かち書きは原則しない

子音字は元々有声音無声音の弁別に加えて、有気音であるか無気音であるかを区別していた。そのため、各調音点における破裂音には計4種類の子音字が存在していた。なお、現在のタイ語では有声無気音及び有声有気音は無声有気音に合流しており、調音点反舌音であった子音は歯茎音に合流している。こうした経緯により現在のタイ文字は同一の音素を表す異なる子音字が複数存在する。現在はこれらの有気音/無気音、有声音/無声音の弁別の代わりに声調の規則の変化が対応付けられており、子音字にはその規則ごとに中子音字・高子音字・低子音字の3つのグループに大別される。子音字は末子音としても振舞うことがあり、その場合一部の文字については発音が変化する。また、母音字については母音の長短によって文字が分けられている。

符号位置の順序はおおむねブラーフミー系文字の文字順に由来する伝統的なタイ文字の順序に従っており、文字名についても伝統的なタイ文字の命名法に従っている。

加えて、アラビア文字やデーヴァナーガリーなどと同様に独自の数字体系(タイ数字)を有している。

Unicodeが登場する以前のタイ文字の文字コード規格であるTIS 620-2533に由来する文字セットが元となっている。

Unicodeのバージョン1.0においても「タイ文字(Thai)」というブロック名で制定されていた[1]

収録文字

[編集]

ラテン文字転写」の列はタイ文字のラテン文字への翻字方式の一つであるISO 11940英語版に従う。

コード 文字 文字名(英語) 用例・説明 ラテン文字転写
子音字
U+0E01 THAI CHARACTER KO KAI ゴー・ガイ(鶏のゴー)。

子音[k]を表す中子音字。

k
U+0E02 THAI CHARACTER KHO KHAI コー・カイ(卵のコー)。

子音[kʰ]を表す高子音字。

k̄h
U+0E03 THAI CHARACTER KHO KHUAT コー・クアット(瓶のコー)。

子音[kʰ]を表す高子音字。元々は[x]を表していた。kho khai ขから分化した字。

現在は廃字となっており、使われていない。

ḳ̄h
U+0E04 THAI CHARACTER KHO KHWAI コー・クワーイ(水牛のコー)。

子音[kʰ]を表す低子音字。元々は有声無気音[ɡ]だった。

kh
U+0E05 THAI CHARACTER KHO KHON コー・コン(人のコー)。

子音[kʰ]を表す低子音字。元々は[ɣ]を表していた。kho khwai คから分化した字。

現在は廃字となっており、使われていない。

k̛h
U+0E06 THAI CHARACTER KHO RAKHANG コー・ラカン(鐘のコー)。

子音[kʰ]を表す低子音字。元々は有声有気音[ɡʱ]だった。

ḳh
U+0E07 THAI CHARACTER NGO NGU コ゚ー・ク゚ー(蛇のコ゚ー)。

子音[ŋ]を表す低子音字。

ng
U+0E08 THAI CHARACTER CHO CHAN チョー・チャーン(皿のチョー)。

子音[t͡ɕ]を表す中子音字。

c
U+0E09 THAI CHARACTER CHO CHING チョー・チン(銅鑼のチョー)。

子音[tɕʰ]を表す高子音字。

c̄h
U+0E0A THAI CHARACTER CHO CHANG チョー・チャーン(象のチョー)。

子音[tɕʰ]を表す低子音字。元々は有声無気音[d͡ʑ]だった。

ch
U+0E0B THAI CHARACTER SO SO ソー・ソー(鎖のソー)。

子音[s]を表す低子音字。cho chang(ช)から分化した字。

s
U+0E0C THAI CHARACTER CHO CHOE チョー・チャー(木のチョー)。

子音[tɕʰ]を表す低子音字。元々は有声有気音[d͡ʑʱ]だった。

c̣h
U+0E0D THAI CHARACTER YO YING ヨー・イン(女のヨー)。

子音[j]を表す低子音字。元々は[ɲ]を表していた。

U+0E0E THAI CHARACTER DO CHADA ドー・チャダー(冠のドー)。

子音[d]を表す中子音字。元々は反舌音の[ɖ]を表していた。

U+0E0F THAI CHARACTER TO PATAK トー・パタック(突き棒のトー)。

子音[t]を表す中子音字。元々は反舌音の[ʈ]を表していた。do chada(ฎ)から分化した字。

U+0E10 THAI CHARACTER THO THAN トー・ターン(台座のトー)。

子音[tʰ]を表す高子音字。元々は反舌音の[ʈʰ]を表していた。

ṭ̄h
U+0E11 THAI CHARACTER THO NANGMONTHO トー・ナンモントー(モントー夫人のトー)。

子音[tʰ]を表す低子音字。元々は反舌音の有声無気音[ɖ]だった。

ṯh
U+0E12 THAI CHARACTER THO PHUTHAO トー・プータオ(年長者のトー)。

子音[tʰ]を表す低子音字。元々は反舌音の有声有気音[ɖʱ]だった。

t̛h
U+0E13 THAI CHARACTER NO NEN ノー・ネーン(見習い僧のノー)。

子音[n]を表す低子音字。元々は反舌音の[ɳ]を表していた。

U+0E14 THAI CHARACTER DO DEK ドー・デック(子供のドー)。

子音[d]を表す中子音字。

d
U+0E15 THAI CHARACTER TO TAO トー・タオ(亀のトー)。

子音[t]を表す中子音字。do dek(ด)から分化した字。

t
U+0E16 THAI CHARACTER THO THUNG トー・トゥン(袋のトー)。

子音[tʰ]を表す高子音字。

t̄h
U+0E17 THAI CHARACTER THO THAHAN トー・タハーン(兵士のトー)。

子音[tʰ]を表す低子音字。元々は有声無気音[d]だった。

th
U+0E18 THAI CHARACTER THO THONG トー・トン(旗のトー)。

子音[tʰ]を表す低子音字。元々は有声有気音[dʱ]だった。

ṭh
U+0E19 THAI CHARACTER NO NU ノー・ヌー(鼠のノー)。

子音[n]を表す低子音字。

n
U+0E1A THAI CHARACTER BO BAIMAI ボー・バイマーイ(葉のボー)。

子音[b]を表す中子音字。

b
U+0E1B THAI CHARACTER PO PLA ポー・プラー(魚のポー)。

子音[p]を表す中子音字。bo baimai(บ)から分化した字。

p
U+0E1C THAI CHARACTER PHO PHUNG ポー・プン(蜂のポー)。

子音[pʰ]を表す高子音字。

p̄h
U+0E1D THAI CHARACTER FO FA フォー・ファー(蓋のフォー)。

子音[f]を表す高子音字。pho phung(ผ)から分化した字。

U+0E1E THAI CHARACTER PHO PHAN ポー・パーン(食台のポー)。

子音[pʰ]を表す低子音字。元々は有声無気音[b]だった。

ph
U+0E1F THAI CHARACTER FO FAN フォー・ファン(歯のフォー)。

子音[f]を表す低子音字。pho phan(พ)から分化した字。

f
U+0E20 THAI CHARACTER PHO SAMPHAO ポー・サンパオ(ジャンク船のポー)。

子音[pʰ]を表す低子音字。元々は有声有気音[bʱ]だった。

p̣h
U+0E21 THAI CHARACTER MO MA モー・マー(馬のモー)。

子音[m]を表す低子音字。

m
U+0E22 THAI CHARACTER YO YAK ヨー・ヤック(夜叉のヨー)。

子音[j]を表す低子音字。

y
U+0E23 THAI CHARACTER RO RUA ロー・ルア(船のロー)。

子音[r]を表す低子音字。

r
U+0E24 THAI CHARACTER RU 音節主音化した短母音としてのR(IPA:[r̩])を表す。

サンスクリット語の表記に用いられる[2]

v
U+0E25 THAI CHARACTER LO LING ロー・リン(猿のロー)。

子音[l]を表す低子音字。

l
U+0E26 THAI CHARACTER LU 音節主音化した短母音としてのL(IPA:[l̩])を表す。

サンスクリット語の表記に用いられる[2]

ł
U+0E27 THAI CHARACTER WO WAEN ウォー・ウェーン(指輪のウォー)。

子音[w]を表す低子音字。

w
U+0E28 THAI CHARACTER SO SALA ソー・サーラー(休憩所のソー)。

子音[s]を表す高子音字。元々は歯茎硬口蓋音の[ɕ]を表していた。

ṣ̄
U+0E29 THAI CHARACTER SO RUSI ソー・ルーシー (隠者のソー)。

子音[s]を表す高子音字。元々は反舌音の[ʂ]を表していた。

s̛̄
U+0E2A THAI CHARACTER SO SUA ソー・スーア(虎のソー)。

子音[s]を表す高子音字。

U+0E2B THAI CHARACTER HO HIP ホー・ヒープ(葛籠のホー)。

子音[h]を表す高子音字。

低子音字の文字の声調タイプを高子音字に置き換えるための文字としても用いられる。

U+0E2C THAI CHARACTER LO CHULA ロー・チュラー(凧のロー)。

子音[l]を表す低子音字。元々は反舌音の[ɭ]を表していた。

U+0E2D THAI CHARACTER O ANG オー・アーン(洗面器のオー)。

子音[ʔ]あるいは頭子音が無いことを表す中子音字。

母音[ə]及び[ɔ]とそれらの長母音を表す際にも用いられる。

x
U+0E2E THAI CHARACTER HO NOKHUK ホー・ノックフーク(梟のホー)。

子音[h]を表す低子音字。

記号
U+0E2F THAI CHARACTER PAIYANNOI パイヤーンノーイ(ไปยาลน้อย)。タイ文字における略語記号。ラテン文字などにおける省略のピリオド(.)に相当する。

また、古典的には句点(.)としても用いられていた。

ǂ/ǀ[3]
母音記号
U+0E30 THAI CHARACTER SARA A 末子音が無い場合の短母音[a]を表す。 a
U+0E31 THAI CHARACTER MAI HAN-AKAT マーイ・ハン・アーカート(ไม้หันอากาศ)。

末子音が有る場合の短母音[a]を表す。

U+0E32 THAI CHARACTER SARA AA 長母音[aː]を表す。 ā
U+0E33 THAI CHARACTER SARA AM 鼻母音[ɑm]を表す。 å
U+0E34 THAI CHARACTER SARA I 短母音[i]を表す。 i
U+0E35 THAI CHARACTER SARA II 長母音[iː]を表す。 ī
U+0E36 THAI CHARACTER SARA UE 短母音[ɯ]を表す。
U+0E37 THAI CHARACTER SARA UEE 長母音[ɯː]を表す。 ụ̄
U+0E38 THAI CHARACTER SARA U 短母音[u]を表す。 u
U+0E39 THAI CHARACTER SARA UU 長母音[uː]を表す。 ū
U+0E3A THAI CHARACTER PHINTHU パーリ語においてヴィラーマ(無母音)の音訳に用いられる[2] ̥
通貨記号
U+0E3F ฿ THAI CURRENCY SYMBOL BAHT タイ王国の通貨単位、バーツの通貨記号。
母音記号
U+0E40 THAI CHARACTER SARA E 短母音[e]を表す。 e
U+0E41 THAI CHARACTER SARA AE 短母音[ɛ]を表す。 æ
U+0E42 THAI CHARACTER SARA O 短母音[o]を表す。 o
U+0E43 THAI CHARACTER SARA AI MAIMUAN マーイ・ムーアン。二重母音[aɪ]を表す。

20個の単語のみで用いられる。

ı
U+0E44 THAI CHARACTER SARA AI MAIMALAI マーイ・マラーイ。二重母音[aɪ]を表す。
長母音化記号
U+0E45 THAI CHARACTER LAKKHANGYAO 0E24 ฤ 或いは 0E26 ฦ で使用され、音節主音化した流音を長母音として発音することを表す[2] ɨ
繰り返し記号
U+0E46 THAI CHARACTER MAIYAMOK マーイ・ヤモック(ไม้ยมก)。直前の単語を2回繰り返して発音することを表す記号。日本語における「」などにあたる。 «
母音記号
U+0E47 THAI CHARACTER MAITAIKHU 母音[e](เ), [ɛ](แ), 及びオー・アーン(อ)を用いて表記する母音[ɔ]について末子音がある場合に子音字の上に書かれる記号。 ̆
声調記号
U+0E48 THAI CHARACTER MAI EK マーイ・エーク(ไม้เอก)。子音字の声調を変化させることを表す記号。第1段階。数字の1に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

̀
U+0E49 THAI CHARACTER MAI THO マーイ・トー(ไม้โท)。子音字の声調を変化させることを表す記号。第2段階。数字の2に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

̂
U+0E4A THAI CHARACTER MAI TRI マーイ・トリー(ไม้ตรี)。子音字の声調を変化させることを表す記号。第3段階。数字の3に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

́
U+0E4B THAI CHARACTER MAI CHATTAWA マーイ・チャッタワー(ไม้จัตวา)。子音字の声調を変化させることを表す記号。第4段階。数字の4に由来する。

子音の分類(高・中・低)によってどの声調になるのかの規則が異なる。

ˇ
記号
U+0E4C THAI CHARACTER THANTHAKHAT マーイ・タンタカート(ไม้ทัณฑฆาต)、或いはガーラン(การันต์)。

子音字の上に付き、語源の都合で書かれているが実際には発音されない黙字を表す記号。黙字符[2]

̒
U+0E4D THAI CHARACTER NIKHAHIT ニッカヒット(นิคหิต)。サンスクリット語パーリ語の音訳において鼻母音化を表す[2]アヌスヴァーラに対応する。

現在のタイ語では母音am(ำ)にその名残がある。

̊
U+0E4E THAI CHARACTER YAMAKKAN ヤマッカン(ยามักการ)。

サンスクリット語パーリ語の表記においてヴィラーマと同様の働き(無母音化)をする。同時に発音される2つの子音クラスターの一部である子音を示す。

~
U+0E4F THAI CHARACTER FONGMAN フォーンマン(ฟองมัน)。スタンザ(詩の節)の開始を表すほか、ブレットとしても用いられる[2] §
数字
U+0E50 THAI DIGIT ZERO タイ文字における数字の0 0
U+0E51 THAI DIGIT ONE タイ文字における数字の1 1
U+0E52 THAI DIGIT TWO タイ文字における数字の2 2
U+0E53 THAI DIGIT THREE タイ文字における数字の3 3
U+0E54 THAI DIGIT FOUR タイ文字における数字の4 4
U+0E55 THAI DIGIT FIVE タイ文字における数字の5 5
U+0E56 THAI DIGIT SIX タイ文字における数字の6 6
U+0E57 THAI DIGIT SEVEN タイ文字における数字の7 7
U+0E58 THAI DIGIT EIGHT タイ文字における数字の8 8
U+0E59 THAI DIGIT NINE タイ文字における数字の9 9
記号
U+0E5A THAI CHARACTER ANGKHANKHU アンカン(อังคั่น)。長い章の終わりを示すために用いられる[2]

また、0E30 ะと組み合わせて詩(スタンザ)の終わりを示すために用いられる[2]

ǁ
U+0E5B THAI CHARACTER KHOMUT コームート(โคมูตร)。章や文書の終わりを示すために用いられる[2] »

小分類

[編集]

このブロックの小分類は「子音字」(Consonants)、「記号」(Signs)、「母音記号」(Vowels)、「通貨記号」(Currency symbol)、「長母音化記号」(Vowel length sign)、「繰り返し記号」(Repetition mark)、「声調記号」(Tone marks)、「数字」(Digits)の8個となっている[2]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。

子音字(Consonants

[編集]

この小分類にはタイ文字のうち、基本的な子音字が収録されている。

記号(Signs

[編集]

この小分類にはタイ文字のうち、記号や約物などの類が収録されている。

母音記号(Vowels

[編集]

この小分類にはタイ文字のうち、子音字に結合する母音記号が収録されている。U+0E40-0E44の文字については、視覚的な順序では子音の前にある。[2]他のブラーフミー系文字では子音の左側にレンダーされる母音記号を発音順に入力する方式を取っているものが多いが、タイ文字では文字が書かれる順番通りに入力することとなっている。そのため、文字の符号化文字列とレンダー位置とか入れ替わることは無い。

通貨記号(Currency symbol

[編集]

この小分類にはタイ王国の通貨単位であるバーツ通貨記号1つのみが収録されている。

長母音化記号(Vowel length sign

[編集]

この小分類にはタイ文字においてパーリ語の音訳を表記する際に、音節主音化した流音を長母音として発音することを表す記号1つのみが収録されている。

繰り返し記号(Repetition mark

[編集]

この小分類にはタイ文字において直前の単語を2回繰り返して読むことを表す繰り返し記号1つのみが収録されている。

声調記号(Tone marks

[編集]

この小分類にはタイ文字のうち、子音の声調を変化させるための記号が収録されている。なお、1つの声調記号に対して声調が一対一で対応しているわけではなく、付けられた先の子音が高子音字・中子音字・低子音字のうちいずれのグループに属するかによって声調の規則が異なる。

数字(Digits

[編集]

この小分類にはタイ文字で用いられる固有の数字が収録されている。

文字コード

[編集]
タイ文字(Thai)[1]
Official Unicode Consortium code chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E0x
U+0E1x
U+0E2x
U+0E3x ฿
U+0E4x
U+0E5x
U+0E6x
U+0E7x
注釈
1.^バージョン15.1時点


履歴

[編集]

以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。

バージョン コードポイント[a] 文字数 L2 ID ドキュメント
1.0.0 87 (to be determined)
  1. ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。

出典

[編集]
  1. ^ 3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年7月15日閲覧。
  2. ^ a b c d e f g h i j k l "The Unicode Standard, Version 15.1 - U0E00.pdf" (PDF). The Unicode Standard (英語). 2024年8月9日閲覧
  3. ^ 省略記号(paiyannoi)としてはǂ、句点としてはǀと翻字される。

関連項目

[編集]