アラビア文字 (Unicodeのブロック)
アラビア文字 (Unicodeのブロック) | |
---|---|
Arabic | |
範囲 |
U+0600..U+06FF (256 個の符号位置) |
面 | 基本多言語面 |
用字 |
アラビア文字 ペルシャ文字 |
主な言語・文字体系 | |
割当済 | 256 個の符号位置 |
未使用 | 0 個の保留 |
Unicodeのバージョン履歴 | |
1.0.0 | 169 (+169) |
1.1 | 194 (+25) |
3.0 | 206 (+12) |
3.2 | 208 (+2) |
4.0 | 227 (+19) |
4.1 | 235 (+8) |
5.1 | 250 (+15) |
6.0 | 252 (+2) |
6.1 | 253 (+1) |
6.3 | 254 (+1) |
7.0 | 255 (+1) |
14.0 | 256 (+1) |
公式ページ | |
コード表 ∣ ウェブページ |
アラビア文字(アラビアもじ、英語: Arabic)は、Unicodeの13個目のブロック。
解説
[編集]中東及び北アフリカ地域に広がるアラブ圏で広く話されている、イスラム教の聖典言語であるアラビア語に加え、イランの公用語であるペルシャ語、パキスタンの公用語であるウルドゥー語、アフガニスタンの公用語であるパシュトー語、中華人民共和国・新疆ウイグル自治区に居住するテュルク系少数民族であるウイグル人に話されているウイグル語、イラク・イラン・トルコ等のクルディスタン地域に居住するクルド人に話されているクルド語(特にソラニー方言)などの、ムスリムの多く居住するイスラム圏で用いられる他の言語の表記にも用いられるアラビア文字を収録している。
現在はアラビア文字での表記が一般的ではなくなっているものの、かつては正書法がアラビア文字であったトルコ語、アゼルバイジャン語(ただしイランなどに居住するアゼルバイジャン人の話す南アゼルバイジャン語では現在もアラビア文字を用いる)、マレー語、カザフ語などのための文字や、現在は死語となっているオスマン語、古典アラビア語などのための文字も本ブロックに含まれている。
アラビア文字は音素文字のうち、子音のみを記述するアブジャドであり、「アブジャド」の名称もアラビア文字の古典的な並び順(アブジャド順)における最初の4文字(アリフ、バー、ジーム、ダール)に由来している。一般的な文書では母音を記述しないが、イスラム教の聖典であるクルアーン(コーラン)や、初学者及び初等教育用の教材など正しい単語の読みを明示する必要がある文書ではシャクルと呼ばれる母音記号が用いられるため、これらの記号も本ブロックに収録されている。
書字方向はヘブライ文字などと同様に右から左へと横書きされ(右横書き)、一部の例外となる文字を除いてラテン文字の筆記体のように同じ単語の文字同士は繋げて綴られる。また、各文字はその単語内の位置によって独立形、語頭形、語中形、語末形の4種類の形状を取るが、本ブロック内においては単語内の位置による字形差は符号位置上は統一されており、フォント内でその挙動を制御する仕様になっている。但し、一部の文字についてはアラビア文字表示形A及びアラビア文字表示形Bブロックに単語内位置における字形差の符号位置を分けられたものが収録されている。
なお、アラビア文字から派生した、ペルシャ語を表記するためのペルシャ文字や、ウルドゥー語の表記に用いられるウルドゥー文字、パンジャーブ語やラフンダー語などの表記に用いられるシャームキー文字、かつてマレー語の表記に用いられていたジャウィ文字(ただしタイに居住するマレー系民族の話すジャウィ語では現在でも使われ、マレーシアにおいても看板などの地名表記には現在でも使われている)、インドネシアでかつてジャワ語やスンダ語、マドゥラ語などの表記に用いられていたぺゴン文字、ナイジェリアやニジェールなどで話されるハウサ語及び、ブルキナファソやマリで話されるフラニ語の表記に用いられるアジャミ、かつてマダガスカル語の表記に用いられていたソラベ文字などは文献によっては別の文字体系として扱われていることがあるが、Unicode上はアラビア文字の変種として扱われ、同じ文字体系として扱われている。また、ウルドゥー語やカシミール語の表記に用いられるアラビア文字はナスタアリーク体と呼ばれる一般的なアラビア文字とは大きく字形の異なる書体が使われているが、こちらもUnicode上はアラビア文字と同じ表記体系として扱われているため、これらの文字も本ブロックに含まれている。
Unicodeのバージョン1.0においても「アラビア文字(Arabic)」というブロック名で制定されていた。[1]
収録文字
[編集]「ラテン文字転写」の列はアラビア文字のラテン翻字方式の一つであるISO 233に従う。なお、言語名の後に括弧書きで年号や年号の範囲が書かれているものについては、その期間でのみ使われたことがあり、現在では廃字となってその言語では用いられなくなっているか、あるいは一般的な表記ではなくなっていることを表す。
コード | 文字 | 文字名(英語) | 用例・説明 | ラテン文字転写 |
---|---|---|---|---|
ベースライン下方のマーカー | ||||
U+0600 | | ARABIC NUMBER SIGN | アラビア文字における番号記号。ラテン文字などの"#"にあたる。アラビア・インド数字で書かれた数値の下に書かれる。[2][3] | |
U+0601 | | ARABIC SIGN SANAH | アラビア文字において年号の数値の下に書かれる記号。[2][3]
U+0604 とは異なり主にグレゴリオ暦やイスラム暦(ヒジュラ暦)で用いられ、グレゴリオ暦の場合は年号とこの記号の後に「キリスト教の」を意味するアラビア語عيسوي ʿīsawīの略である字母ain(U+0639 ع)の語頭形を、イスラム暦の場合はムハンマドの聖遷(ヒジュラ)を表すアラビア語 هجري hijrīの略である字母heh doachashmee(U+06BE ھ)を記す。[4] |
|
U+0602 | | ARABIC FOOTNOTE MARKER | アラビア文字において脚註を示す際に用いられる記号で、註釈が必要な個所に脚註番号を表すアラビア・インド数字の下に書かれて、ページの下部などに再度同じ数字とこの記号の組み合わせが使われて註釈の情報が記される。[2][3][5] | |
U+0603 | | ARABIC SIGN SAFHA | ||
U+0604 | | ARABIC SIGN SAMVAT | ウルドゥー語でヴィクラマ暦の年号を書くために使用する記号。[6]年号を示すアラビア・インド数字の下に書かれて、書かれた数値がヴィクラマ暦による年数の表記であることを示す。[4] | |
ベースライン上方のマーカー | ||||
U+0605 | | ARABIC NUMBER MARK ABOVE | コプト暦数字で用いられることがある。[6] | |
根号 | ||||
U+0606 | ؆ | ARABIC-INDIC CUBE ROOT | アラビア文字における3乗根(立方根)の数学記号。[7] | |
U+0607 | ؇ | ARABIC-INDIC FOURTH ROOT | アラビア文字における4乗根(二重平方数)の数学記号。[7] | |
文字様記号 | ||||
U+0608 | ؈ | ARABIC RAY | アラビア文字における数学記号で「直線」を表す。[7] | |
約物 | ||||
U+0609 | ؉ | ARABIC-INDIC PER MILLE SIGN | アラビア文字における千分率(パーミル)の記号。[7] | |
U+060A | ؊ | ARABIC-INDIC PER TEN THOUSAND SIGN | アラビア文字における万分率の記号。[7] | |
通貨記号 | ||||
U+060B | ؋ | AFGHANI SIGN | アフガニスタンの公定通貨であるアフガニの通貨記号。 | |
約物 | ||||
U+060C | ، | ARABIC COMMA | アラビア文字における読点(コンマ)。 | |
U+060D | ؍ | ARABIC DATE SEPARATOR | アラビア文字において、日付と月の名前の間の区切りに使われる記号。[2][3] | |
詩用記号 | ||||
U+060E | ؎ | ARABIC POETIC VERSE SIGN | 詩においてビュレットとして用いられる記号。行の先頭に書かれる。[2][5][3] | |
U+060F | ؏ | ARABIC SIGN MISRA | ||
敬称用記号 | ||||
U+0610 | ؐ | ARABIC SIGN SALLALLAHOU ALAYHE WASSALLAM | イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。
「彼に神の平安と祝福がありますように」を意味するアラビア語"sallallahu alayhe wasallam"を表す。[6][2][3][8] |
|
U+0611 | ؑ | ARABIC SIGN ALAYHE ASSALLAM | イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。 | |
U+0612 | ؒ | ARABIC SIGN RAHMATULLAH ALAYHE | イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。
「神が彼に慈悲を与えますように」を意味するアラビア語"rahmatullah alayhe"を表す。[6][2][3][8] |
|
U+0613 | ؓ | ARABIC SIGN RADI ALLAHOU ANHU | イスラム教において宗教上重要な聖人や偉人の名前の上に敬意を表すために書かれる祈りの言葉。 | |
U+0614 | ؔ | ARABIC SIGN TAKHALLUS | 詩人の名前や名前の上に置かれる記号、または一部の文章ですべての固有名詞をマークするために使用される記号。[6][2][3][8] | |
クルアーンの註釈記号 | ||||
U+0615 | ؕ | ARABIC SMALL HIGH TAH | イラン及びパキスタンで出版される一部のクルアーンで、読み上げ中に休止すべき位置を示す記号。[6]
U+0679 ٹ などの一部の文字の発音記号として使用される小さな TAH 記号と混同しないこと。[6] |
|
拡張アラビア記号 | ||||
U+0616 | ؖ | ARABIC SMALL HIGH LIGATURE ALEF WITH LAM WITH YEH | ARABIC SMALL HIGH LIGATURE ALEF WITH YEH BARREEとも呼ぶ。[6] | |
クルアーンの註釈記号 | ||||
U+0617 | ؗ | ARABIC SMALL HIGH ZAIN | イランのクルアーンで用いられる記号で、本文中に出現する箇所で一時停止してもよいが、間を置かずに経典を読み上げることが推奨されることを示すために使用される。アラブ圏でのクルアーンにおけるU+06D6 ۖと同じ役割を持つ。[10] | |
U+0618 | ؘ | ARABIC SMALL FATHA | 064E َ FATHA と混同しないこと。[6]これらの通常のものより小さなシャクルはクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10] | |
U+0619 | ؙ | ARABIC SMALL DAMMA | 064F ُ DAMMAと混同しないこと。[6]これらの通常のものより小さなシャクルはクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10] | |
U+061A | ؚ | ARABIC SMALL KASRA | 0650 ِ KASRAと混同しないこと。[6]これらの通常のものより小さなシャクルはクルアーンで使用され、節の頭の字母アリフ(U+0627 ا)に付加される。前の節から休止を挟まずに経典を読む場合にアリフが表す子音[ʔ]を発音せずに前の節の最後の子音に小さなシャクルが表す母音を付加して読むことを表す。[10] | |
約物 | ||||
U+061B | ؛ | ARABIC SEMICOLON | アラビア文字におけるセミコロン。 | |
制御文字 | ||||
U+061C | | ARABIC LETTER MARK | ラテン文字などの左横書き文字とアラビア文字が混在している双方向テキストで直前の文字がアラビア文字であることを表す際に用いられる制御文字。具体的なグリフや文字幅を持たない。
主に番号付きリストや数式、日付と共に用いられ、数字の直前にこの文字を置くことで、算用数字を自動的にアラビア・インド数字に変換し、数字の位置が右寄せになるように調整されることを意図している。[11] 一般的にALMと略される。[6] |
|
約物 | ||||
U+061D | ؝ | ARABIC END OF TEXT MARK | 最後の文章の末尾に通常のピリオドの代わりに付けられる約物。[12] | |
U+061E | ؞ | ARABIC TRIPLE DOT PUNCTUATION MARK | ハウサ語、ウォロフ語、フラニ語、マンディンカ語などのアフリカの言語における古い正書法で句点(ピリオド)として用いられていた記号。現在は使われなくなった。[13] | |
U+061F | ؟ | ARABIC QUESTION MARK | アラビア文字における疑問符。 | |
カシミール語用の追加文字 | ||||
U+0620 | ؠ | ARABIC LETTER KASHMIRI YEH | カシミール語 | |
ISO 8859-6に基づく文字 | ||||
U+0621 | ء | ARABIC LETTER HAMZA | ハムザ。子音[ʔ]を表す。 | ˌ |
U+0622 | آ | ARABIC LETTER ALEF WITH MADDA ABOVE | マッダの付いたアリフ。[ʔaː]という発音を表す。 | |
U+0623 | أ | ARABIC LETTER ALEF WITH HAMZA ABOVE | ハムザが上に付いたアリフ。[ʔa]または[ʔu]という発音を表す。 | ˈ |
U+0624 | ﺅ | ARABIC LETTER WAW WITH HAMZA ABOVE | ハムザの付いたワーウ。[ʔu]という発音を表す。
パシュトー語では母音[o]、バローチー語では二重長母音[ɑuː]、アゼルバイジャン語(南アゼルバイジャン語)、トルクメン語(イラン、アフガニスタン国内で)では母音[ø]を表す。 |
|
U+0625 | ﺇ | ARABIC LETTER ALEF WITH HAMZA BELOW | ハムザが下に付いたアリフ。[ʔi]という発音を表す。 | ʾ |
U+0626 | ﺉ | ARABIC LETTER YEH WITH HAMZA ABOVE | ハムザが付いたヤー。[ʔi]という発音を表す。
パシュトー語では二重母音[aɪ]を、オルムル語では二重母音[əɪ]を、バローチー語、アゼルバイジャン語(南アゼルバイジャン語)、タタール語(1920~1927)では母音[ɛ]を表す。 |
|
U+0627 | ا | ARABIC LETTER ALEF | アリフ。子音[ʔ]を表す。
ウイグル語、アゼルバイジャン語(南アゼルバイジャン語)では母音[a]を表す。 |
ʾ |
U+0628 | ب | ARABIC LETTER BEH | バー。子音[b]を表す。 | b |
U+0629 | ة | ARABIC LETTER TEH MARBUTA | ター・マルブータ。必ず語末にのみ現れ、女性名詞語尾である[-at]を表す。
アラビア語でしか使われない。 |
ẗ |
U+062A | ﺕ | ARABIC LETTER TEH | ター。子音[t]を表す。 | t |
U+062B | ﺙ | ARABIC LETTER THEH | サー。子音[θ]を表す。 | ṯ |
U+062C | ج | ARABIC LETTER JEEM | ジーム。子音[d͡ʒ]を表す。 | ǧ |
U+062D | ﺡ | ARABIC LETTER HAH | ハー。子音[ħ]を表す。 | ḥ |
U+062E | ﺥ | ARABIC LETTER KHAH | ハー。子音[x]を表す。 | ẖ |
U+062F | د | ARABIC LETTER DAL | ダール。子音[d]を表す。 | d |
U+0630 | ذ | ARABIC LETTER THAL | ザール。子音[ð]を表す。 | ḏ |
U+0631 | ر | ARABIC LETTER REH | ラー。子音[r]を表す。 | r |
U+0632 | ز | ARABIC LETTER ZAIN | ザイン。子音[z]を表す。 | z |
U+0633 | س | ARABIC LETTER SEEN | スィーン。子音[s]を表す。 | s |
U+0634 | ﺵ | ARABIC LETTER SHEEN | シーン。子音[ʃ]を表す。 | š |
U+0635 | ص | ARABIC LETTER SAD | サード。子音[sˤ]を表す。咽頭化した[s]。 | ṣ |
U+0636 | ض | ARABIC LETTER DAD | ダード。子音[dˤ]を表す。咽頭化した[d]。
咽頭化した子音はアラビア語以外の言語では珍しく、発音のしづらさから俗にアラビア語を母語とするアラブ人のことを「ダードの民」と呼ぶことがある。 |
ḍ |
U+0637 | ط | ARABIC LETTER TAH | ター。子音[tˤ]を表す。咽頭化した[t]。 | ṭ |
U+0638 | ﻅ | ARABIC LETTER ZAH | ザー。子音[ðˤ]を表す。咽頭化した[ð]。 | ẓ |
U+0639 | ع | ARABIC LETTER AIN | アイン。子音[ʕ]を表す。 | ʿ |
U+063A | غ | ARABIC LETTER GHAIN | ガイン。子音[ɣ]を表す。 | ġ |
早期ペルシャ語及びアゼルバイジャン語用の追加文字 | ||||
U+063B | ػ | ARABIC LETTER KEHEH WITH TWO DOTS ABOVE | 早期ペルシャ語(10~16世紀)[9]
子音[ɡ]やその異音である[ŋ]を表していたが、のちにU+06AF گ、U+06AB ګ、U+06AD ڭに置換され使われなくなった。[9] |
|
U+063C | ؼ | ARABIC LETTER KEHEH WITH THREE DOTS BELOW | 早期ペルシャ語(10~16世紀)[9]
子音[ɡ]やその異音である[ŋ]を表していたが、のちにU+06AF گ、U+06AB ګ、U+06AD ڭに置換され使われなくなった。[9] |
|
U+063D | ؽ | ARABIC LETTER FARSI YEH WITH INVERTED V | アゼルバイジャン語(1992~)[9] | |
U+063E | ؾ | ARABIC LETTER FARSI YEH WITH TWO DOTS ABOVE | 早期ペルシャ語(10~16世紀)[9]
長母音[iː]を表す。異なる語源による文法上の違いや強勢の有無を明示するために用いられた。[9] |
|
U+063F | ؿ | ARABIC LETTER FARSI YEH WITH THREE DOTS ABOVE | 早期ペルシャ語(10~16世紀)[9]
長母音[iː]を表す。異なる語源による文法上の違いや強勢の有無を明示するために用いられた。[9] |
|
ISO 8859-6に基づく文字 | ||||
U+0640 | ـ | ARABIC TATWEEL | タットウィールあるいはカシーダ(kashida)。[6]強調や割付の調整などの目的で文字を引き伸ばすため、あるいは文法書などでベースとなる文字なしで単独の母音記号などを表記したり、文字の位置による字形変化を示すために用いられる。[6]
アドラム文字、ハニーフィー・ロヒンギャ文字、マンダ文字、マニ文字、詩篇パフラヴィー文字、ソグド文字、シリア文字でも使用される。[6] |
|
U+0641 | ﻑ | ARABIC LETTER FEH | ファー。子音[f]を表す。 | f |
U+0642 | ﻕ | ARABIC LETTER QAF | カーフ。子音[q]を表す。 | q |
U+0643 | ك | ARABIC LETTER KAF | カーフ。子音[k]を表す。 | k |
U+0644 | ل | ARABIC LETTER LAM | ラーム。子音[l]を表す。 | l |
U+0645 | م | ARABIC LETTER MEEM | ミーム。子音[m]を表す。 | m |
U+0646 | ن | ARABIC LETTER NOON | ヌーン。子音[n]を表す。 | n |
U+0647 | ه | ARABIC LETTER HEH | ハー。子音[h]を表す。 | h |
U+0648 | ﻭ | ARABIC LETTER WAW | ワーウ。子音[w]を表す。但しペルシャ語や、タジク語などペルシャ文字を借用した言語のいくつかでは[v]を表す。
アラビア語ではこの文字単独でwaと読み、「~と(AND)」を表す。 カシミール語では長母音[oː]を、キルギス語、ダルグワ語(1920~1928)では母音[o]を、カラカルパク語(~1932)では母音[o]あるいは母音[ø]を表す。 |
w |
U+0649 | ﻯ | ARABIC LETTER ALEF MAKSURA | アラビア語では、アリフの変種の一つであり、定冠詞がつくことで長母音[aː]から短母音[a]に変化したことを表すアリフ・マクスーラとして用いられる。現在では発音されなくなったが、元は語尾に[-j]を伴っていたことに由来する。
ウイグル語などでは母音を表すために、どの位置で書かれていても下にドットの付かない ヤーと同形の文字として用いられる。[6]なお、子音[j]については通常の字母ya(U+064A ﻱ)を用いる。 ウイグル語、ボスニア語(15世紀~19世紀)、ダルグワ語(1920~1928)では母音[i]を、キルギス語、カラカルパク語(~1932)、トルクメン語(~1929)では母音[i]あるいは[ɯ]を、カザフ語では母音[ə]を表す。 この文字とは別にDOTLESS YEHと命名されている文字があるが、こちらはペルシャ語などで用いられるヤーの変種の一つで、単語中の書かれる位置によって点がついたり付かなかったりするため、挙動の違いから符号位置を分けられている。 U+0654 ٔ と組み合わせて使用することは意図されていない。[6] |
ỳ |
U+064A | ﻱ | ARABIC LETTER YEH | ヤー。子音[j]を表す。
U+0654 ٔ と組み合わせて使用すると下部の点が消える。[6] 一方、それ以外の結合記号と組み合わせて使用しても下部の点は消えない。[6] |
y |
ISO 8859-6典拠の母音記号 | ||||
U+064B | ً | ARABIC FATHATAN | ファトハタン。母音[-an]を表す母音記号(シャクル)。 | |
U+064C | ٌ | ARABIC DAMMATAN | ダンマタン。母音[-un]を表す母音記号(シャクル)。
異体字として、片方が180度回転した2 つの絡み合ったダンマとして書かれることもある。[6] |
|
U+064D | ٍ | ARABIC KASRATAN | カスラタン。母音[-in]を表す母音記号(シャクル)。 | |
U+064E | َ | ARABIC FATHA | ファトハ。母音[-a]を表す母音記号(シャクル)。 | |
U+064F | ُ | ARABIC DAMMA | ダンマ。母音[-u]を表す母音記号(シャクル)。 | |
U+0650 | ِ | ARABIC KASRA | カスラ。母音[-i]を表す母音記号(シャクル)。 | |
U+0651 | ّ | ARABIC SHADDA | シャッダ。子音字を重子音で読むことを表す記号(シャクル)。日本語で言う「っ」にあたる。 | |
U+0652 | ْ | ARABIC SUKUN | スクーン。無母音であり、子音のみを発音することを表す記号(シャクル)。[6]
一部のクルアーンでは、長母音が無視されていることを示すために使用される。[6] 通常は小さな円で書かれるが、クルアーンにおいては異体字のU+06E1 ۡのような形で書かれることもある。[6] アゼルバイジャン語(南アゼルバイジャン語)、トルクメン語(イラン、アフガニスタン国内で)においては字母waw(U+0648 ﻭ)と共に用いられ、母音[o]を表す。 |
|
結合用のマッダ及びハムザ | ||||
U+0653 | ٓ | ARABIC MADDAH ABOVE | マッダ。[aː]という長母音を表す。U+0622を参照。
南アジア及びインドネシアの正書法ではmadd jaa'izに使用される。[6] |
|
U+0654 | ٔ | ARABIC HAMZA ABOVE | アラビア語などではアリフ、ワーウ、ヤーに付いて頭子音[ʔ]があることを表す記号であるハムザとして使われる。
ペルシャ語などでは二つの単語の間におかれ[-i-]と発音される「~の(of)」を表すエザーフェと呼ばれる接語を表し、発音のみならず文法的な機能も明示するためこの記号が用いられる。[14] この文字はハムザ及びエザーフェとしての用途に限定される。[6] カシミール語では母音[ə]を表す。 |
|
U+0655 | ٕ | ARABIC HAMZA BELOW | ハムザ。アリフ、ワーウ、ヤーに付いて頭子音[ʔ]があることを表す記号。母音[-i]も伴うことを示す。
カシミール語では母音[ɨ]を表す。 |
|
その他の結合記号 | ||||
U+0656 | ٖ | ARABIC SUBSCRIPT ALEF | 長母音[iː]を表す。あるいは、ペルシア語やウルドゥー語など/i/と/e/の弁別がある言語において/e/ではなく/i/であることを示す母音記号。[2] | |
U+0657 | ٗ | ARABIC INVERTED DAMMA | 長母音[uː]を表す。あるいは、ペルシア語やウルドゥー語など/u/と/o/の弁別がある言語において/o/ではなく/u/であることを示す母音記号。[2]
ulta peshとも呼ばれる。[6] カシミール語、ウルドゥー語[6] カシミール語では字母waw(U+0648 و)と共に用いられ、長母音[uː]を表す。 |
|
U+0658 | ٘ | ARABIC MARK NOON GHUNNA | ウルドゥー語、バローチー語[6]、シャームキー文字(西パンジャーブ語、ラフンダー語)
ウルドゥー語では鼻音化を[6]、シャームキー文字では鼻母音を表す。
|
|
U+0659 | ٙ | ARABIC ZWARAKAY | パシュトー語[6]母音[ə]を表す。[15] | |
U+065A | ٚ | ARABIC VOWEL SIGN SMALL V ABOVE | アフリカの諸言語[6]、カシミール語[16]
カシミール語ではU+06D2 ےと共に用いられ、母音[e]を表す。 |
|
U+065B | ٛ | ARABIC VOWEL SIGN INVERTED SMALL V ABOVE | アフリカの諸言語[6]、アゼルバイジャン語(南アゼルバイジャン語)、トルクメン語(イラン、アフガニスタン国内で)、ボスニア語(15世紀~19世紀)
アゼルバイジャン語、トルクメン語ではU+06CC یと共に用いられ、母音[ɯ]を表す。 |
|
U+065C | ٜ | ARABIC VOWEL SIGN DOT BELOW | アフリカの諸言語[6]
アフリカや他の地域の正書法におけるクルアーンの文章で使用される。[6] |
|
U+065D | ٝ | ARABIC REVERSED DAMMA | アフリカの諸言語[6](ソンガイ語、プラール語、ザルマ語、フラニ語など)[18] | |
U+065E | ٞ | ARABIC FATHA WITH TWO DOTS | カラム語[6]カラム語では前母音の[a]と後母音の[ɑ]を弁別するため、前母音を表すためにこの記号を使用する。後母音には通常のファトハ(U+064E َ)が使われる。[18] | |
U+065F | ٟ | ARABIC WAVY HAMZA BELOW | カシミール語[6]長母音[ɨː]を表す。 | |
アラビア・インド数字 | ||||
U+0660 | ٠ | ARABIC-INDIC DIGIT ZERO | アラビア語で用いられるアラビア・インド数字の0 | |
U+0661 | ١ | ARABIC-INDIC DIGIT ONE | アラビア語で用いられるアラビア・インド数字の1 | |
U+0662 | ٢ | ARABIC-INDIC DIGIT TWO | アラビア語で用いられるアラビア・インド数字の2 | |
U+0663 | ٣ | ARABIC-INDIC DIGIT THREE | アラビア語で用いられるアラビア・インド数字の3 | |
U+0664 | ٤ | ARABIC-INDIC DIGIT FOUR | アラビア語で用いられるアラビア・インド数字の4 | |
U+0665 | ٥ | ARABIC-INDIC DIGIT FIVE | アラビア語で用いられるアラビア・インド数字の5 | |
U+0666 | ٦ | ARABIC-INDIC DIGIT SIX | アラビア語で用いられるアラビア・インド数字の6 | |
U+0667 | ٧ | ARABIC-INDIC DIGIT SEVEN | アラビア語で用いられるアラビア・インド数字の7 | |
U+0668 | ٨ | ARABIC-INDIC DIGIT EIGHT | アラビア語で用いられるアラビア・インド数字の8 | |
U+0669 | ٩ | ARABIC-INDIC DIGIT NINE | アラビア語で用いられるアラビア・インド数字の9 | |
約物 | ||||
U+066A | ٪ | ARABIC PERCENT SIGN | アラビア文字における百分率(パーセント)の記号。 | |
U+066B | ٫ | ARABIC DECIMAL SEPARATOR | アラビア文字における小数点。 | |
U+066C | ٬ | ARABIC THOUSANDS SEPARATOR | アラビア文字における位取り点。3桁ごとに区切られる。
アラビア文字におけるコンマ(U+060C ،)と同様の形状をしており、ラテン文字などのコンマを180度回転させたような形状をしている。[19] |
|
U+066D | ٭ | ARABIC FIVE POINTED STAR | アラビア文字におけるアスタリスク。
書体によって様々な字形に変化する。[6] |
|
古代の文字 | ||||
U+066E | ٮ | ARABIC LETTER DOTLESS BEH | 初期のアラビア語における字母バー(U+0628 ب)の字形。
元々は点が付いておらず、ター(U+062A ﺕ)やサー(U+062B ﺙ)と字形上は区別されていなかった。[20][21] |
|
U+066F | ٯ | ARABIC LETTER DOTLESS QAF | 初期のアラビア語における字母カーフ(U+0642 ﻕ)の字形。 | |
母音記号 | ||||
U+0670 | ٰ | ARABIC LETTER SUPERSCRIPT ALEF | 小アリフあるいは短剣アリフ。長母音[aː]を表す。 هذا hādhā (これ)のhāの部分のように通常の綴り上でアリフが書かれない場合に用いられる。
文字名に反して、実際には母音記号である。[6] ハウサ語ではU+065C ٜと共に用いられ、長母音[eː]を表す。 |
|
拡張アラビア文字 | ||||
U+0671 | ٱ | ARABIC LETTER ALEF WASLA | ワスラの付いたアリフ。文頭以外での定冠詞"(a)l-"など、発音上は読まれないアリフを表す。
クルアーンにおけるアラビア語で用いられる。[6] |
|
U+0672 | ٲ | ARABIC LETTER ALEF WITH WAVY HAMZA ABOVE | バローチー語、カシミール語[6]カシミール語では長母音[əː]を表す。 | |
非推奨文字 | ||||
U+0673 | ٳ | ARABIC LETTER ALEF WITH WAVY HAMZA BELOW | カシミール語[6]長母音[ɨː]を表す。
この文字は非推奨であるため、使用は強く推奨されない。Unicodeでは代わりにU+0627 U+065Fの2文字のシーケンス(اٟ)で表記することを推奨している。[6] |
|
高位置のハムザ | ||||
U+0674 | ٴ | ARABIC LETTER HIGH HAMZA | カザフ語、ジャウィ語[6] | |
カザフ語用の二重音字 | ||||
U+0675 | ٵ | ARABIC LETTER HIGH HAMZA ALEF | Unicode上はU+0674 U+0627 ٴا の2文字で表記することが推奨されている。[6]
母音[æ]を表す。 |
|
U+0676 | ٶ | ARABIC LETTER HIGH HAMZA WAW | Unicode上はU+0674 U+0648 ٴو の2文字で表記することが推奨されている。[6]
母音[ø]を表す。 |
|
U+0677 | ٷ | ARABIC LETTER U WITH HAMZA ABOVE | Unicode上はU+0674 U+06C7 ٴۇ の2文字で表記することが推奨されている。[6]
母音[ʉ]を表す。 |
|
U+0678 | ٸ | ARABIC LETTER HIGH HAMZA YEH | Unicode上はU+0674 U+0649 ٴى の2文字で表記することが推奨されている。[6]
母音[ɘ]あるいは二重母音[əɪ]を表す。 |
|
拡張アラビア文字 | ||||
U+0679 | ٹ | ARABIC LETTER TTEH | ウルドゥー語[6]、バローチー語、カシミール語、パンジャーブ語(西パンジャーブ語)、ラフンダー語、ブルシャスキー語、ロヒンギャ語、トルワル語、シナー語
子音[ʈ]を表す。 |
|
U+067A | ٺ | ARABIC LETTER TTEHEH | シンド語[6]子音[ʈʰ]を表す。 | |
U+067B | ٻ | ARABIC LETTER BEEH | シンド語[6]、ハウサ語
子音[ɓ]を表す。 |
|
U+067C | ټ | ARABIC LETTER TEH WITH RING | パシュトー語[6]、オルムル語
子音[ʈ]を表す。 |
|
U+067D | ٽ | ARABIC LETTER TEH WITH THREE DOTS ABOVE DOWNWARDS | シンド語[6]
子音[ʈ]を表す。 |
|
U+067E | پ | ARABIC LETTER PEH | ペルシャ語、ウルドゥー語[6]、パシュトー語、ウイグル語、シンド語、バローチー語、カシミール語、クルド語(ソラニー方言)、パンジャーブ語(西パンジャーブ語)、ラフンダー語、カザフ語、キルギス語、タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語、ブルシャスキー語、アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語など。
子音[p]を表す。 ペルシャ文字を借用した多くの地域で共通して使われる。 |
|
U+067F | ٿ | ARABIC LETTER TEHEH | シンド語[6]子音[tʰ]を表す。 | |
U+0680 | ڀ | ARABIC LETTER BEHEH | シンド語[6]子音[bʱ]を表す。 | |
U+0681 | ځ | ARABIC LETTER HAH WITH HAMZA ABOVE | パシュトー語[6]、コワール語、オルムル語 | |
U+0682 | ڂ | ARABIC LETTER HAH WITH TWO DOTS VERTICAL ABOVE | 現代のパシュトー語では使用されない。[6] | |
U+0683 | ڃ | ARABIC LETTER NYEH | シンド語[6]、アディゲ語(~1927)、ダルグワ語(1920~1928) | |
U+0684 | ڄ | ARABIC LETTER DYEH | シンド語、サライキ語、ボスニア語(15世紀~19世紀)[6] | |
U+0685 | څ | ARABIC LETTER HAH WITH THREE DOTS ABOVE | パシュトー語、ホラズム語[6]、ブルシャスキー語、ダルグワ語(1920~1928)、トルワル語、シナー語、コワール語、オルムル語
パシュトー語[6]、トルワル語、シナー語、コワール語及びオルムル語では子音[t͡s]を、ブルシャスキー語では子音[ʈ͡ʂ]を、ダルグワ語では子音[q]を表す。 |
|
U+0686 | چ | ARABIC LETTER TCHEH | ペルシャ語、ウルドゥー語[6]、パシュトー語、ウイグル語、シンド語、バローチー語、カシミール語、ジャウィ文字(マレー語)、ぺゴン文字、クルド語(ソラニー方言)、パンジャーブ語(西パンジャーブ語)、ラフンダー語、カザフ語、キルギス語、タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語、ブルシャスキー語、アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語など。
ペルシャ文字を借用した多くの地域で共通して使われる。 |
|
U+0687 | ڇ | ARABIC LETTER TCHEHEH | シンド語[6]、トルワル語、シナー語
シンド語では子音[cʰ]を、トルワル語及びシナー語では子音[ʈ͡ʂ]を表す。 |
|
U+0688 | ڈ | ARABIC LETTER DDAL | ウルドゥー語[6]、バローチー語、カシミール語、パンジャーブ語(西パンジャーブ語)、ラフンダー語、ブルシャスキー語、アディゲ語(~1927)、ロヒンギャ語、トルワル語、シナー語、サライキ語、コワール語 | |
U+0689 | ډ | ARABIC LETTER DAL WITH RING | パシュトー語[6]、オルムル語
子音[ɖ]を表す。 |
|
U+068A | ڊ | ARABIC LETTER DAL WITH DOT BELOW | シンド語、早期ペルシャ語、ぺゴン文字、マダガスカル語[6]シンド語では子音[ɖ]を表す。 | |
U+068B | ڋ | ARABIC LETTER DAL WITH DOT BELOW AND SMALL TAH | ラフンダー語[6] | |
U+068C | ڌ | ARABIC LETTER DAHAL | シンド語[6]子音[dʱ]を表す。 | |
U+068D | ڍ | ARABIC LETTER DDAHAL | シンド語[6]子音[ɖʱ]を表す。 | |
U+068E | ڎ | ARABIC LETTER DUL | 字母DULの古い字形で、シンド語では現在廃止されている。[6] | |
U+068F | ڏ | ARABIC LETTER DAL WITH THREE DOTS ABOVE DOWNWARDS | シンド語[6]
字母DULの現在の字形。[6] 子音[ɗ]を表す。 |
|
U+0690 | ڐ | ARABIC LETTER DAL WITH FOUR DOTS ABOVE | 古いウルドゥー語で使用されていたが、現在は使用されていない。[6] | |
U+0691 | ڑ | ARABIC LETTER RREH | ウルドゥー語[6]、カシミール語、パンジャーブ語(西パンジャーブ語)、ラフンダー語、ブルシャスキー語、ロヒンギャ語、トルワル語、シナー語、サライキ語、コワール語
子音[ɽ]を表す。 |
|
U+0692 | ڒ | ARABIC LETTER REH WITH SMALL V | クルド語(ソラニー方言、中央クルド語)[6]、オルムル語 | |
U+0693 | ړ | ARABIC LETTER REH WITH RING | パシュトー語[6]、オルムル語
子音[ɽ]を表す。 |
|
U+0694 | ڔ | ARABIC LETTER REH WITH DOT BELOW | クルド語(ソラニー方言、中央クルド語)、早期ペルシャ語[6] | |
U+0695 | ڕ | ARABIC LETTER REH WITH SMALL V BELOW | クルド語(ソラニー方言、中央クルド語)[6]震え音(巻き舌)の子音[r]を表す。なお、クルド語において通常の字母ra(U+0631 ر)は弾き音の子音[ɾ]を表す。 |
|
U+0696 | ږ | ARABIC LETTER REH WITH DOT BELOW AND DOT ABOVE | パシュトー語[6]子音[ʐ]、[ʝ]あるいは[ɡ]を表す。 | |
U+0697 | ڗ | ARABIC LETTER REH WITH TWO DOTS ABOVE | ダルグワ語[6]、アディゲ語(~1927)、ダルグワ語(1920~1928)
アディゲ語、ダルグワ語では子音[t͡sʼ]を表す。 |
|
U+0698 | ژ | ARABIC LETTER JEH | ペルシャ語、ウルドゥー語[6]、パシュトー語、ウイグル語、バローチー語、カシミール語、クルド語(ソラニー方言)、パンジャーブ語(西パンジャーブ語)、ラフンダー語、タジク語(旧正書法)、ウズベク語(~1929)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、オスマン語、ブルシャスキー語、アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)など。
子音[ʒ]を表す。但しカシミール語では子音[t͡s]を表す。 ペルシャ文字を借用した多くの地域で共通して使われる。 |
|
U+0699 | ڙ | ARABIC LETTER REH WITH FOUR DOTS ABOVE | シンド語[6]、トルワル語、シナー語 | |
U+069A | ښ | ARABIC LETTER SEEN WITH DOT BELOW AND DOT ABOVE | パシュトー語[6]子音[ʂ]、[ç]あるいは[x]を表す。 | |
U+069B | ڛ | ARABIC LETTER SEEN WITH THREE DOTS BELOW | 早期ペルシャ語[6] | |
U+069C | ڜ | ARABIC LETTER SEEN WITH THREE DOTS BELOW AND THREE DOTS ABOVE | アラビア語モロッコ方言(ダリジャ)[6] | |
U+069D | ڝ | ARABIC LETTER SAD WITH TWO DOTS BELOW | テュルク語[6]、ダルグワ語(1920~1928)
ダルグワ語では子音[t͡s]を表す。 |
|
U+069E | ڞ | ARABIC LETTER SAD WITH THREE DOTS ABOVE | ベルベル語、ブルシャスキー語[6]、ダルグワ語(1920~1928)
ベルベル語では子音[zˤ]を、ブルシャスキー語では子音[ʈ͡ʂʰ]を、ダルグワ語では子音[t͡s]を表す。 |
|
U+069F | ڟ | ARABIC LETTER TAH WITH THREE DOTS ABOVE | 古いハウサ語[6]、ぺゴン文字ハウサ語では子音[(t)͡sʼ]を、ぺゴン文字では子音[ʈ]を表す。 | |
U+06A0 | ڠ | ARABIC LETTER AIN WITH THREE DOTS ABOVE | ジャウィ文字、ぺゴン文字、ダルグワ語(1920~1928)、ロヒンギャ語、シナー語
ジャウィ文字、ぺゴン文字、シナー語では子音[ŋ]を表す。 ダルグワ語では子音[q:]を表す。 |
|
U+06A1 | ڡ | ARABIC LETTER DOTLESS FEH | アディゲ語(~1927)[6] | |
U+06A2 | ڢ | ARABIC LETTER FEH WITH DOT MOVED BELOW | アラビア語マグリブ方言[6][22]、ダルグワ語(1920~1928)
ダルグワ語では子音[pʼ]を表す。 |
|
U+06A3 | ڣ | ARABIC LETTER FEH WITH DOT BELOW | イングーシ語(~20世紀初頭)[6] | |
U+06A4 | ڤ | ARABIC LETTER VEH | 中東のアラビア語で外来語の表記に用いられる。[6]
クルド語(ソラニー方言、中央クルド語)、ホラズム語、早期ペルシャ語、ジャウィ文字(マレー語、ジャウィ語)[6]、ぺゴン文字、アディゲ語(~1927)、ロヒンギャ語 |
|
U+06A5 | ڥ | ARABIC LETTER FEH WITH THREE DOTS BELOW | 北アフリカのアラビア語で外来語の表記に用いられる。[6] | |
U+06A6 | ڦ | ARABIC LETTER PEHEH | シンド語[6]子音[pʰ]を表す。 | |
U+06A7 | ڧ | ARABIC LETTER QAF WITH DOT ABOVE | アラビア語マグリブ方言[22]、ウイグル語[6] | |
U+06A8 | ڨ | ARABIC LETTER QAF WITH THREE DOTS ABOVE | アラビア語チュニジア方言[6] | |
U+06A9 | ک | ARABIC LETTER KEHEH | kaf mashkulaとも呼ばれる。[6]
ペルシャ語、ウルドゥー語、シンド語[6]、パシュトー語、バローチー語、カシミール語、クルド語(ソラニー方言)、パンジャーブ語(西パンジャーブ語)、ラフンダー語、タジク語(旧正書法)、トルクメン語(~1929)、ブルシャスキー語、アディゲ語(~1927)、ダルグワ語(~1928)、タタール語(1920~1927)、ロヒンギャ語など。 ペルシャ文字を借用した多くの地域では通常のkaf(U+0643 ك)の代わりに子音[k]を表すために共通して使われる。 シンド語では有気音の子音[kʰ]を表す。 |
|
U+06AA | ڪ | ARABIC LETTER SWASH KAF | シンド語
無気音の子音[k]を表す。 |
|
U+06AB | ګ | ARABIC LETTER KAF WITH RING | パシュトー語[6]、オルムル語
子音[ɡ]を表す。 |
|
U+06AC | ڬ | ARABIC LETTER KAF WITH DOT ABOVE | ジャウィ文字のGAFへの使用は推奨されないが、既存のテキストデータには見られる場合がある。ジャウィ文字GAFに推奨される文字はアラビア文字補助ブロックに含まれるU+0762 ݢである。[6] | |
U+06AD | ڭ | ARABIC LETTER NG | ウイグル語、カザフ語、アラビア語モロッコ方言(ダリジャ)[23]、初期ジャウィ文字(マレー語)、初期ペルシャ語[6]、キルギス語、トルクメン語(~1929)、オスマン語、タタール語(1920~1927)など。
ウイグル語、カザフ語、キルギス語、トルクメン語、オスマン語、タタール語では子音[ŋ]を表す。 |
|
U+06AE | ڮ | ARABIC LETTER KAF WITH THREE DOTS BELOW | ベルベル語、初期ペルシャ語[6]、ダルグワ語(~1920)
ダルグワ語では子音[ɡ]を表す。 ぺゴン文字(インドネシアにおけるアラビア文字)においては子音[ɡ]を表す字母U+08B4 ࢴの異体字としても用いられる。[6] |
|
U+06AF | گ | ARABIC LETTER GAF | ペルシャ語、ウルドゥー語[6]、ウイグル語、シンド語、バローチー語、カシミール語、クルド語(ソラニー方言)、パンジャーブ語(西パンジャーブ語)、ラフンダー語、カザフ語、タジク語(旧正書法)、ウズベク語(~1929)、カラカルパク語(~1932)、トルクメン語(~1929)、オスマン語、ブルシャスキー語、アディゲ語(~1927)、ダルグワ語(1920~1928)、タタール語(1920~1927)、ロヒンギャ語、ソマリ語(1932~1972)など。
ペルシャ文字を借用した多くの地域で共通して使われる。 |
|
U+06B0 | ڰ | ARABIC LETTER GAF WITH RING | ラフンダー語[6] | |
U+06B1 | ڱ | ARABIC LETTER NGOEH | シンド語[6]
子音[ŋ]を表す。 |
|
U+06B2 | ڲ | ARABIC LETTER GAF WITH TWO DOTS BELOW | シンド語では使用されない。[6] | |
U+06B3 | ڳ | ARABIC LETTER GUEH | シンド語[6]、サライキ語
子音[ɠ]を表す。 |
|
U+06B4 | ڴ | ARABIC LETTER GAF WITH THREE DOTS ABOVE | カラカルパク語(~1932)
子音[ŋ]を表す。 |
|
U+06B5 | ڵ | ARABIC LETTER LAM WITH SMALL V | クルド語(ソラニー方言、中央クルド語)、ボスニア語(15世紀~19世紀)[6]クルド語では子音[ɫ]を、ボスニア語では子音[ʎ]を表す。 | |
U+06B6 | ڶ | ARABIC LETTER LAM WITH DOT ABOVE | クルド語(ソラニー方言、中央クルド語)[6] | |
U+06B7 | ڷ | ARABIC LETTER LAM WITH THREE DOTS ABOVE | クルド語(ソラニー方言、中央クルド語)[6] | |
U+06B8 | ڸ | ARABIC LETTER LAM WITH THREE DOTS BELOW | ||
U+06B9 | ڹ | ARABIC LETTER NOON WITH DOT BELOW | ||
U+06BA | ں | ARABIC LETTER NOON GHUNNA | ウルドゥー語、古いアラビア語[6]、カシミール語、ラフンダー語、ブルシャスキー語、ロヒンギャ語、トルワル語、オルムル語
ウルドゥー語、カシミール語、ラフンダー語、ブルシャスキー語、トルワル語、オルムル語では鼻母音を表す。但し、語末以外では通常の字母nun(U+0646 ن)を用いる。 古いアラビア語では元々点が書かれていなかった。 独立形・語頭形・語中形・語末形のいずれにおいても点が書かれない。[6] |
|
U+06BB | ڻ | ARABIC LETTER RNOON | シンド語[6]
子音[ɳ]を表す。 |
|
U+06BC | ڼ | ARABIC LETTER NOON WITH RING | パシュトー語[6]、オルムル語
子音[ɳ]を表す。 |
|
U+06BD | ڽ | ARABIC LETTER NOON WITH THREE DOTS ABOVE | ジャウィ文字(マレー語、ジャウィ語)[6][23]
子音[ɳ]を表す。 独立形と語末形では3つの点が文字の上側に配置されるが、語頭形と語中形ではU+062B ثとの混同を防ぐために3つの点が文字の下側に移動する。[24] |
|
U+06BE | ھ | ARABIC LETTER HEH DOACHASHMEE | ウルドゥー語及びその他の南アジアの言語で直前の子音が有気音であることを示す二重音字を形成する。[6] | |
U+06BF | ڿ | ARABIC LETTER TCHEH WITH DOT ABOVE | ||
U+06C0 | ۀ | ARABIC LETTER HEH WITH YEH ABOVE | オルムル語
Unicodeのバージョン1.0では"arabic letter hamzah on ha"という文字名だった。[6] ペルシャ語などのエザーフェとして使う場合は、言語に適した基字の上にU+0654 ٔを使用する。[6] オルムル語では母音[ə]を表す。 |
|
U+06C1 | ہ | ARABIC LETTER HEH GOAL | ウルドゥー語[6]、バローチー語、アディゲ語(~1927) | |
U+06C2 | ۂ | ARABIC LETTER HEH GOAL WITH HAMZA ABOVE | ウルドゥー語[6] | |
U+06C3 | ۃ | ARABIC LETTER TEH MARBUTA GOAL | ウルドゥー語[6] | |
U+06C4 | ۄ | ARABIC LETTER WAW WITH RING | カシミール語[6]母音[ɔ]を表す。 | |
U+06C5 | ۅ | ARABIC LETTER KIRGHIZ OE | キルギス語[6]母音[ø]を表す。
ワーウの尾部がループ状になっているものと、尾部を突き抜けるように横線が書かれているものの2種類のグリフのバリエーションが存在する。[6] |
|
U+06C6 | ۆ | ARABIC LETTER OE | ウイグル語、クルド語(ソラニー方言、中央クルド語)、カザフ語、アゼルバイジャン語(南アゼルバイジャン語)、ボスニア語(15世紀~19世紀)[6]、トルクメン語(イラン、アフガニスタン国内で)、アディゲ語(~1927)
ウイグル語では母音[ø]を、カシミール語、クルド語では母音[o]を、アゼルバイジャン語、トルクメン語では母音[y]を、カザフ語では子音[v]を、ボスニア語では母音[u]を、アディゲ語では二重母音[ɜw]または[wɜ]を表す。 |
|
U+06C7 | ۇ | ARABIC LETTER U | アゼルバイジャン語(南アゼルバイジャン語)、カザフ語、キルギス語、ウイグル語[6]、バローチー語、クルド語(ソラニー方言)、カラカルパク語(~1932)、トルクメン語(~1929)、タタール語(1920~1927)
ウイグル語、バローチー語、アゼルバイジャン語、キルギス語では母音[u]を、カラカルパク語では母音[u]または母音[y]を、カザフ語では母音[ʊ]を、クルド語では長母音[uː]を、トルクメン語では母音[ø]または母音[y]を、タタール語では母音[o]を表す。 |
|
U+06C8 | ۈ | ARABIC LETTER YU | ウイグル語[6]、クルド語(ソラニー方言) | |
U+06C9 | ۉ | ARABIC LETTER KIRGHIZ YU | カザフ語、キルギス語、ボスニア語(15世紀~19世紀)[6]キルギス語では母音[y]を、ボスニア語では母音[o]を表す。 | |
U+06CA |
ۊ |
ARABIC LETTER WAW WITH TWO DOTS ABOVE | クルド語(ソラニー方言、中央クルド語)[6] | |
U+06CB | ۋ | ARABIC LETTER VE | ウイグル語、カザフ語[6]、キルギス語、カラカルパク語(~1932)、タタール語(1920~1927)
ウイグル語、キルギス語、タタール語では子音[v]を、カラカルパク語では子音[v]あるいは子音[w]を、カザフ語では二重母音[ʉw]を表す。 |
|
U+06CC | ی | ARABIC LETTER FARSI YEH | アラビア語、ペルシャ語、ウルドゥー語、カシミール語[6][16]、バローチー語、クルド語(ソラニー方言)、ラフンダー語、タジク語(旧正書法)、ウズベク語(~1929)、トルクメン語(~1929)、アディゲ語(~1927)、タタール語(1920~1927)など。
語頭形と語中形には、通常のya(U+064A ﻱ)と同様に下部に二つ点が付いている[6]が、独立形、語末形では点が消える。 U+0654 ٔ と組み合わせて使用すると、語頭形と語中形でも点が付いた字形になる。[6] ペルシャ文字を借用した多くの地域では通常のya(U+064A ﻱ)の代わりに子音[j]を表すために共通して使われる。 カシミール語、クルド語では長母音[iː]を、タタール語では母音[i]を表す。 |
|
U+06CD | ۍ | ARABIC LETTER YEH WITH TAIL | パシュトー語、シンド語[6]パシュトー語では二重母音[əɪ]を表す。 | |
U+06CE | ێ | ARABIC LETTER YEH WITH SMALL V | クルド語(ソラニー方言、中央クルド語)[6]
母音[e]を表す。 |
|
U+06CF |
ۏ | ARABIC LETTER WAW WITH DOT ABOVE | バローチー語、ジャウィ文字(マレー語、ジャウィ語)、ぺゴン文字バローチー語では長母音[oː]を、ジャウィ文字、ぺゴン文字では子音[v]を表す。 | |
U+06D0 | ې | ARABIC LETTER E | パシュトー語、ウイグル語[6]、オルムル語 | |
U+06D1 | ۑ | ARABIC LETTER YEH WITH THREE DOTS BELOW | メンデ諸語[23]、ハウサ語[6]、ぺゴン文字ぺゴン文字では子音[ɲ]を表す。 |
|
U+06D2 | ے | ARABIC LETTER YEH BARREE | ウルドゥー語、バローチー語[6]、カシミール語、パンジャーブ語(西パンジャーブ語)、ラフンダー語、ブルシャスキー語、トルワル語、シナー語、サライキ語、コワール語
長母音[eː]を表す。 |
|
U+06D3 | ۓ | ARABIC LETTER YEH BARREE WITH HAMZA ABOVE | ウルドゥー語[6] | |
約物 | ||||
U+06D4 | ۔ | ARABIC FULL STOP | ウルドゥー語[6]における句点(ピリオド)。
文字名は"arabic full stop"となっているが、アラビア語など他のアラビア文字を用いる言語においては、ラテン文字などで用いられる通常のピリオド(.)が用いられる。 |
|
拡張アラビア文字 | ||||
U+06D5 | ە | ARABIC LETTER AE | ウイグル語、カザフ語、キルギス語[6]、アゼルバイジャン語(南アゼルバイジャン語)、カラカルパク語(~1932)、トルクメン語(~1929)、ボスニア語(15世紀~19世紀)、アディゲ語(~1927)
ウイグル語、アゼルバイジャン語では母音[æ]を、カザフ語、キルギス語、トルクメン語、ボスニア語では母音[e]を、カラカルパク語では母音[æ]または母音[e]を、アディゲ語では二重母音[ɜj]または[jɜ]を表す。 |
|
クルアーンの註釈記号 | ||||
U+06D6 | ۖ | ARABIC SMALL HIGH LIGATURE SAD WITH LAM WITH ALEF MAKSURA | アラブ圏のクルアーンで用いられる記号で、本文中に出現する箇所で一時停止してもよいが、間を置かずに経典を暗唱することが推奨されることを示すために使用される。イランでのクルアーンにおけるU+0617 ؗと同じ役割を持つ。[10] | |
U+06D7 | ۗ | ARABIC SMALL HIGH LIGATURE QAF WITH LAM WITH ALEF MAKSURA | ||
U+06D8 | ۘ | ARABIC SMALL HIGH MEEM INITIAL FORM | ||
U+06D9 | ۙ | ARABIC SMALL HIGH LAM ALEF | ||
U+06DA | ۚ | ARABIC SMALL HIGH JEEM | ||
U+06DB | ۛ | ARABIC SMALL HIGH THREE DOTS | ||
U+06DC | ۜ | ARABIC SMALL HIGH SEEN | ||
U+06DD | | ARABIC END OF AYAH | クルアーンにおいて節の終わりを示す結合記号で、その節の番号を示すアラビア・インド数字ががシンボル内に書かれる。 | |
U+06DE | ۞ | ARABIC START OF RUB EL HIZB | ルブ・エル・ヒズブ。節の一部の境界[6]、特に章の終わりを示す。
通常、8つの角をもつシンボルとして描かれ、星のように見える場合とそうでない場合がある。[6] |
|
U+06DF | ۟ | ARABIC SMALL HIGH ROUNDED ZERO | スクーン(U+0652 ْ)に使用される円形よりも小さなサイズの円。[6] | |
U+06E0 | ۠ | ARABIC SMALL HIGH UPRIGHT RECTANGULAR ZERO | 「rectangular zero(長方形のゼロ)」という文字名は、この記号のアラビア語名の直訳である。[6] | |
U+06E1 | ۡ | ARABIC SMALL HIGH DOTLESS HEAD OF KHAH | クルアーンにおけるスクーン(U+0652 ْ)は一般的にこの字形で書かれる。[2][25]
但しUnicode公式においてはこの文字を直接使用せず、フォント技術を用いて異体字を選択することが推奨されている。[6] |
|
U+06E2 | ۢ | ARABIC SMALL HIGH MEEM ISOLATED FORM | ||
U+06E3 | ۣ | ARABIC SMALL LOW SEEN | ||
U+06E4 | ۤ | ARABIC SMALL HIGH MADDA | 通常は U+06E5 ۥ U+06E6 ۦ U+06E7ۧ、及びU+08F3 ࣳと共に使われる。[6] | |
U+06E5 | ۥ | ARABIC SMALL WAW | ||
U+06E6 | ۦ | ARABIC SMALL YEH | ||
U+06E7 | ۧ | ARABIC SMALL HIGH YEH | ||
U+06E8 | ۨ | ARABIC SMALL HIGH NOON | ||
U+06E9 | ۩ | ARABIC PLACE OF SAJDAH | サジダ。クルアーンにおいて、体を伏せて礼拝の姿勢をとるべき箇所に書かれる記号。 | |
U+06EA | ۪ | ARABIC EMPTY CENTRE LOW STOP | カシミール語で口蓋化を表すのにも用いられる。[16] | |
U+06EB | ۫ | ARABIC EMPTY CENTRE HIGH STOP | ||
U+06EC | ۬ | ARABIC ROUNDED HIGH STOP WITH FILLED CENTRE | アフリカや他の地域の正書法におけるクルアーンの文章でも、ワスラ、ikhtilasなどを表すために使用される。[6] | |
U+06ED | ۭ | ARABIC SMALL LOW MEEM | ||
パーカリ語用の拡張アラビア文字 | ||||
U+06EE | ۮ | ARABIC LETTER DAL WITH INVERTED V | パーカリ・コリ語子音[ɗ]を表す。[26] | |
U+06EF | ۯ | ARABIC LETTER REH WITH INVERTED V | パーカリ・コリ語子音[ɭ]を表す。[26] | |
東方アラビア・インド数字 | ||||
U+06F0 | ۰ | EXTENDED ARABIC-INDIC DIGIT ZERO | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の0 | |
U+06F1 | ۱ | EXTENDED ARABIC-INDIC DIGIT ONE | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の1 | |
U+06F2 | ۲ | EXTENDED ARABIC-INDIC DIGIT TWO | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の2 | |
U+06F3 | ۳ | EXTENDED ARABIC-INDIC DIGIT THREE | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の3 | |
U+06F4 | ۴ | EXTENDED ARABIC-INDIC DIGIT FOUR | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の4 | |
U+06F5 | ۵ | EXTENDED ARABIC-INDIC DIGIT FIVE | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の5 | |
U+06F6 | ۶ | EXTENDED ARABIC-INDIC DIGIT SIX | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の6 | |
U+06F7 | ۷ | EXTENDED ARABIC-INDIC DIGIT SEVEN | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の7 | |
U+06F8 | ۸ | EXTENDED ARABIC-INDIC DIGIT EIGHT | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の8 | |
U+06F9 | ۹ | EXTENDED ARABIC-INDIC DIGIT NINE | イラン、アフガニスタン、パキスタン、インドで用いられるアラビア・インド数字の9 | |
拡張アラビア文字 | ||||
U+06FA | ۺ | ARABIC LETTER SHEEN WITH DOT BELOW | ||
U+06FB | ۻ | ARABIC LETTER DAD WITH DOT BELOW | ||
U+06FC | ۼ | ARABIC LETTER GHAIN WITH DOT BELOW | ||
シンド語用の記号 | ||||
U+06FD | ۽ | ARABIC SIGN SINDHI AMPERSAND | シンド語におけるアンパサンド記号(ラテン文字における「&」)。 | |
U+06FE | ۾ | ARABIC SIGN SINDHI POSTPOSITION MEN | シンド語における後置詞(助詞)"men"の略字。 | |
パーカリ語用の拡張アラビア文字 | ||||
U+06FF | ۿ | ARABIC LETTER HEH WITH INVERTED V | パーカリ・コリ語子音[h]を表す。なお、パーカリ語において通常の字母heh(U+0647 ه)は有声音の[ɦ]を表す。[26] |
小分類
[編集]このブロックの小分類は「ベースライン下方のマーカー」(Subtending marks)、「ベースライン上方のマーカー」(Supertending mark)、「根号」(Radix symbols)、「文字様記号」(Letterlike symbol)、「約物」(Punctuation)、「通貨記号」(Currency symbol)、「詩用記号」(Poetic marks)、「敬称用記号」(Honorifics)、「クルアーンの註釈記号」(Quranic annotation sign)、「拡張アラビア記号」(Extended Arabic mark)、「制御文字」(Format character)、「カシミール語用の追加文字」(Addition for Kashmiri)、「ISO 8859-6に基づく文字」(Based on ISO 8859-6)、「早期ペルシャ語及びアゼルバイジャン語用の追加文字」(Additions for early Persian and Azerbaijani)、「ISO 8859-6典拠の母音記号」(Tashkil from ISO 8859-6)、「結合用のマッダ及びハムザ」(Combining maddah and hamza)、「その他の結合記号」(Other combining marks)、「アラビア・インド数字」(Arabic-Indic digits)、「古代の文字」(Archaic letters)、「母音記号」(Tashkil)、「拡張アラビア文字」(Extended Arabic letters)、「非推奨文字」(Deprecated letter)、「高位置のハムザ」(High hamza)、「カザフ語用の二重音字」(Digraphic letters for Kazakh)、「パーカリ語用の拡張アラビア文字」(Extended Arabic letters for Parkari)、「東方アラビア・インド数字」(Eastern Arabic-Indic digits)、「シンド語用の記号」(Signs for Sindhi)の26個となっている。[6]
本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。また、収録文字が1文字しかない小分類については小分類名が単数形で表現されているが、本記事では単数形か複数形かによる小分類名の表記ゆれについては別の小分類として扱わず、同一の小分類として扱うこととする。
ベースライン下方のマーカー(Subtending marks)
[編集]この小分類にはアラビア文字において文字列の下方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。
ベースライン上方のマーカー(Supertending mark)
[編集]この小分類にはアラビア文字において文字列の上方に書かれる記号類を収録している。文字列の長さに合わせて記号の長さを伸長させてレンダーすることが望まれている。
根号(Radix symbols)
[編集]この小分類にはアラビア文字において根号を表す数学記号を2種類収録している。
文字様記号(Letterlike symbol)
[編集]この小分類にはアラビア文字における数学記号で直線を表す記号1文字のみを収録している。[7]
約物(Punctuation)
[編集]この小分類にはアラビア文字で用いられる約物類を収録している。
通貨記号(Currency symbol)
[編集]この小分類にはアフガニスタンの公定通貨であるアフガニの通貨記号1文字のみを収録している。
詩用記号(Poetic marks)
[編集]この小分類にはアラビア文字で書かれた詩で用いられる記号2種類のみを収録している。
敬称用記号(Honorifics)
[編集]この小分類にはイスラム教において宗教上特殊な地位のある偉人や聖人の名前を記す際にその人物名の上に書かれる祈りの言葉を表す記号を収録している。[2][8]
クルアーンの註釈記号(Quranic annotation sign)
[編集]この小分類にはイスラム教の聖典であるクルアーンにおいて読み方などを示すために用いられる記号類を収録している。
拡張アラビア記号(Extended Arabic mark)
[編集]この小分類には10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語(早期ペルシャ語)で用いられていた記号を1文字のみ収録している。
制御文字(Format character)
[編集]この小分類には直前の文字がアラビア文字であることを示すために用いられる、具体的なグリフ・文字幅共に持たない制御文字1文字を収録している。
カシミール語用の追加文字(Addition for Kashmiri)
[編集]この小分類にはインドとパキスタンの係争中の土地であるカシミール地方で話されるカシミール語で用いられるアラビア文字の拡張文字を1文字のみ収録している。
ISO 8859-6に基づく文字(Based on ISO 8859-6)
[編集]この小分類には基本的なアラビア文字の字母を収録している。小分類名の通り、アラビア文字の符号化規格の一つであるISO 8859-6に準拠している。表中で特に断りが無い限りはアラビア文字を表記に用いる多くの言語で共通して使用される。
本小分類に属するアラビア文字の名前は、ISO 8859-6 から派生したローマ字表記規則に従う。 これらは、アラビア語の文字名の実際の発音とは異なり、 例えばU+0628 ب ARABIC LETTER BEH は一般的なアラビア語の発音としては「ba'」となる。[6]
早期ペルシャ語及びアゼルバイジャン語用の追加文字(Additions for early Persian and Azerbaijani)
[編集]この小分類には早期ペルシャ語及びアゼルバイジャン語で用いられるアラビア文字の拡張文字を収録している。早期ペルシャ語とは10~11世紀の古代ペルシャ語及び11~16世紀の古典ペルシャ語を纏めた総称であり、かつてのペルシャ語の正書法に用いられていた文字を収録している。[9]
なお、アゼルバイジャンにおけるアゼルバイジャン語については現在はラテン文字が主要な表記体系として用いられているが、イランなどで話される南アゼルバイジャン語では現在もアラビア文字での表記が用いられている。
ISO 8859-6典拠の母音記号(Tashkil from ISO 8859-6)
[編集]この小分類にはイスラム教の聖典であるクルアーンや初学者用、あるいは初等教育用の教材などで用いられる母音などを表記するための補助記号のシャクルを収録している。
なお、小分類名の"Tashkil(タシュキール)"とはシャクルと同根の単語で、アラビア語で「シャクルを振る」という動作をあらわす単語である。
結合用のマッダ及びハムザ(Combining maddah and hamza)
[編集]この小分類にはシャクルのうち、ISO 8859-6に含まれていなかった結合用のマッダとハムザを収録している。
その他の結合記号(Other combining marks)
[編集]この小分類にはアラビア文字を正書法に用いる様々な言語において用いられる結合記号を収録している。
アラビア・インド数字(Arabic-Indic digits)
[編集]この小分類にはアラビア語で一般的に用いられる数字である、アラビア・インド数字(あるいは単にインド数字)を収録している。元来数字はインドで誕生したものであり、それまでのアラブ圏ではアラビア文字をそのまま数字として用いる伝統的なアラビア数字(呼称が同一になってしまっているが現在のラテン文字などで用いられる算用数字とは異なる)を用いていたが、インドから数字のみの用途を持つ文字を借用した結果現在まで使われるようになった経緯がある。そのため、これらの数字は「インド数字」と呼ばれている。
この小分類に属するアラビア・インド数字はアラビア語で使用されるものだが、 イラン、アフガニスタン、パキスタン、インドの諸言語で用いられるインド数字はいくつかの数字について字形が異なる[14]ため、Unicode上では "Eastern Arabic-Indic digits"(U+06F0~06F9) として別の符号領域に分けられている。[6]
古代の文字(Archaic letters)
[編集]この小分類にはアラビア文字のうち、初期の加点による書き分けが存在していなかった時代の字形を2文字収録している。
母音記号(Tashkil)
[編集]この小分類にはシャクルのうち、ISO 8859-6に含まれていなかったものを収録している。
拡張アラビア文字(Extended Arabic letters)
[編集]この小分類にはアラビア文字のうち、アラビア語以外のみならず、ペルシャ語、ウルドゥー語、パシュトー語、クルド語、ウイグル語、カザフ語、アゼルバイジャン語など、アラビア文字を正書法に用いる様々な言語において用いられる拡張文字を収録している。
非推奨文字(Deprecated letter)
[編集]この小分類には他の符号化規格との互換性のために追加されたが現在はUnicode上での利用が推奨されていない文字を1文字収録している。
高位置のハムザ(High hamza)
[編集]この小分類にはカザフスタンなどで話されるカザフ語において二重音字を表記する際に用いられていた文字1文字を収録している。なお、現在カザフスタンにおけるカザフ語ではアラビア文字の使用は一般的に廃止されており、通常はキリル文字で書かれるが、中華人民共和国の新疆ウイグル自治区に居住するカザフ人は今でもアラビア文字を用いた表記を使用している。
カザフ語用の二重音字(Digraphic letters for Kazakh)
[編集]この小分類に属する文字はカザフ語の二重音字として符号化されたが、その互換性分解は望ましい表現順序を反映していない。従って、これらのカザフ語の二重音字の表現には、代わりに要素の正しい順序を持つ2文字の綴りを使用すべきである[6]
パーカリ語用の拡張アラビア文字(Extended Arabic letters for Parkari)
[編集]この小分類にはパキスタンのシンド州などで話されているパーカリ・コリ語(あるいは単にパーカリ語とも呼ばれる)用の拡張アラビア文字を収録している。
東方アラビア・インド数字(Eastern Arabic-Indic digits)
[編集]この小分類にはアラビア文字で一般的に用いられるアラビア・インド数字のうち、イラン、パキスタン、インドのアラビア文字を用いる言語 (ペルシア語、シンド語、ウルドゥー語など) で使用される[6] 字形のものを収録している。一部の数字についてアラビア語で用いられるものとは異なる字形が用いられているため符号位置が分けられている。
ウルドゥー語では更に一部の数字についてアラビア語ものともペルシャ語のものとも異なる字形が用いられることがあるが、こちらはペルシャ語のものと符号位置が統一されている。
シンド語用の記号(Signs for Sindhi)
[編集]この小分類にはパキスタンのシンド州などで話されるシンド語において用いられる略語記号を2種類収録している。
文字コード
[編集] アラビア文字(Arabic)[1] Official Unicode Consortium code chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+060x | | | | | | | ؆ | ؇ | ؈ | ؉ | ؊ | ؋ | ، | ؍ | ؎ | ؏ |
U+061x | ؐ | ؑ | ؒ | ؓ | ؔ | ؕ | ؖ | ؗ | ؘ | ؙ | ؚ | ؛ | ALM | ؝ | ؞ | ؟ |
U+062x | ؠ | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د |
U+063x | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | ػ | ؼ | ؽ | ؾ | ؿ |
U+064x | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
U+065x | ِ | ّ | ْ | ٓ | ٔ | ٕ | ٖ | ٗ | ٘ | ٙ | ٚ | ٛ | ٜ | ٝ | ٞ | ٟ |
U+066x | ٠ | ١ | ٢ | ٣ | ٤ | ٥ | ٦ | ٧ | ٨ | ٩ | ٪ | ٫ | ٬ | ٭ | ٮ | ٯ |
U+067x | ٰ | ٱ | ٲ | ٳ | ٴ | ٵ | ٶ | ٷ | ٸ | ٹ | ٺ | ٻ | ټ | ٽ | پ | ٿ |
U+068x | ڀ | ځ | ڂ | ڃ | ڄ | څ | چ | ڇ | ڈ | ډ | ڊ | ڋ | ڌ | ڍ | ڎ | ڏ |
U+069x | ڐ | ڑ | ڒ | ړ | ڔ | ڕ | ږ | ڗ | ژ | ڙ | ښ | ڛ | ڜ | ڝ | ڞ | ڟ |
U+06Ax | ڠ | ڡ | ڢ | ڣ | ڤ | ڥ | ڦ | ڧ | ڨ | ک | ڪ | ګ | ڬ | ڭ | ڮ | گ |
U+06Bx | ڰ | ڱ | ڲ | ڳ | ڴ | ڵ | ڶ | ڷ | ڸ | ڹ | ں | ڻ | ڼ | ڽ | ھ | ڿ |
U+06Cx | ۀ | ہ | ۂ | ۃ | ۄ | ۅ | ۆ | ۇ | ۈ | ۉ | ۊ | ۋ | ی | ۍ | ێ | ۏ |
U+06Dx | ې | ۑ | ے | ۓ | ۔ | ە | ۖ | ۗ | ۘ | ۙ | ۚ | ۛ | ۜ | | ۞ | ۟ |
U+06Ex | ۠ | ۡ | ۢ | ۣ | ۤ | ۥ | ۦ | ۧ | ۨ | ۩ | ۪ | ۫ | ۬ | ۭ | ۮ | ۯ |
U+06Fx | ۰ | ۱ | ۲ | ۳ | ۴ | ۵ | ۶ | ۷ | ۸ | ۹ | ۺ | ۻ | ۼ | ۽ | ۾ | ۿ |
注釈
|
履歴
[編集]以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン | コードポイント[a] | 文字数 | L2 ID | ドキュメント |
---|---|---|---|---|
1.0 | U+066C | 1 | L2/00-151 | Paul Nelson; Assem Hijazi; Aiman Copty (7 April 2000), Proposal to change glyph shape for U+066C ARABIC THOUSAND SEPARATOR (英語) |
U+0672..0673,0679..06B7,06BA..06BE,
06C0,06C4..06C6,06CA..06CE,06D0,06D2..06D3 |
33 | L2/01-239 | ISO 11822 (15 December 1996), Extension of the Arabic coded character set for bibliographic information interchange (英語) | |
L2/01-329 | Thomas Milo (17 August 2001), Comments on the Arabic block in Unicode (英語) | |||
L2/01-440 | Thomas Milo (2 November 2001), Some comments on the Arabic block in Unicode (英語) | |||
L2/02-021 | Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語) | |||
L2/03-154 | Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語) | |||
L2/12-381 | Roozbeh Pournader (5 November 2012), Initial and medial forms of Arabic Letter Noon Ghunna (英語) | |||
L2/09-406 | India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語) | |||
L2/09-146 | Roozbeh Pournader (16 April 2009), Moving dots and Arabic script shaping: Farsi Yeh’s and Jawi Nya (英語) | |||
L2/10-168 | Kamal Mansour (5 May 2010), Problems with the joining behavior of Arabic Letter Yeh Barree (U+06D2) (英語) | |||
L2/13-119 | Roozbeh Pournader (8 May 2013), Dot positioning of U+06A3 Arabic Letter Feh with Dot Below (英語) | |||
L2/19-002 | Marc Lodewijck (2 January 2019), Comments on three Arabic-derived letters (英語) | |||
U+0647,06D5 | 3 | L2/14-136 | Roozbeh Pournader (8 May 2014), The right hehs for Arabic script orthographies of Sorani Kurdish and Uighur (英語) | |
1.1 | U+06DF..06E1,06E9 | 4 | L2/01-325 | Thomas Milo (14 August 2001), Variants in Arabic script – related to L2/01-304 (英語) |
L2/01-425 | Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語) | |||
L2/05-203 | Rick McGowan (4 August 2005), Public Review Issue #73: Representative Glyphs for Arabic Characters U+06DF, U+06E0, and U+06E1 (英語) | |||
U+06DD | 1 | L2/01-428 | Jonathan Kew; SIL (1 November 2001), Request for clarification regarding ARABIC END OF AYAH and other Arabic enclosing marks (英語) | |
L2/06-332 | Behdad Esfahbod; Roozbeh Pournader (15 October 2006), Proposal to change the Bidi category of five Arabic characters from AL to AN (英語) | |||
U+06EA | 1 | L2/09-406 | India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語) | |
U+06DC,06E3,06E7..06E8 | 4 | |||
3.0 | U+06B8..06B9,06BF,06FA..06FC | 6 | L2/01-239 | ISO 11822 (15 December 1996), Extension of the Arabic coded character set for bibliographic information interchange (英語) |
U+06BE | 1 | L2/01-329 | Thomas Milo (17 August 2001), Comments on the Arabic block in Unicode (英語) | |
U+0653..0655 | 2 | L2/98-409 | Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語) | |
L2/14-127 | Roozbeh Pournader (2 May 2014), Standardizing the order of Arabic combining marks (英語) | |||
L2/17-253 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (29 July 2017), Proposed Draft: Unicode Technical Report Unicode Arabic Mark Ordering Algorithm (英語) | |||
L2/17-395 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (23 October 2017), Proposed Draft: Unicode Technical Report #53, Unicode Arabic Mark Ordering Algorithm (英語) | |||
L2/18-151 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (26 April 2018), Proposed Draft UTR #53, Unicode Arabic Mark Rendering (HTML version) (英語) | |||
L2/18-250 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (23 July 2018), Unicode Arabic Mark Rendering (英語) | |||
L2/18-298 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (14 September 2018), Proposed Draft UTR #53, Unicode Arabic Mark Rendering (HTML version) (英語) | |||
L2/18-305 | Roozbeh Pournader; Bob Hallissy; Lorna Evans (18 September 2018), Working Draft of Draft UTR #53 Unicode Arabic Mark Rendering (英語) | |||
3.2 | U+066E..066F | 2 | L2/98-409 | Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語) |
L2/00-354 | Mark Davis; Kamal Mansour (12 October 2000), Proposal for addition to Arabic repertoire (英語) | |||
L2/01-150 | Unicode Consortium; SC2/WG2 N2357 (4 April 2001), Proposal to encode two Arabic characters to the UCS (英語) | |||
4.0 | U+0653..0655 | 3 | L2/99-130 | SC2 N3320 (14 April 1999), Text for FDAM ballot ISO/IEC 10646 FDAM #27 - Syriac (英語) |
U+0656..0657,0610..0614 | 7 | L2/00-135 | Paul Nelson (7 April 2000), Proposal to add Urdu Epethit and Abbreviation Diacritics to the Arabic Block (英語) | |
L2/01-425 | Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語) | |||
L2/01-426 | Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB) (英語) | |||
U+0600..0602,060D..060E,0658 | 6 | L2/01-425 | Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks (英語) | |
L2/01-426 | Jonathan Kew; SIL (1 November 2001), Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB) (英語) | |||
L2/02-061 | Jonathan Kew (6 February 2002), Bidi committee consensus on Arabic additions from L2/01-425 (英語) | |||
U+06EE..06EF,06FF | 3 | L2/01-427 | Jonathan Kew; SIL (1 November 2001), Proposal to add Parkari letters to Arabic block (1.6 MB) (英語) | |
U+0603 | 1 | L2/02-061 | Jonathan Kew (6 February 2002), Bidi committee consensus on Arabic additions from L2/01-425 (英語) | |
L2/03-034 | Paul Nelson; Fiona Ross; Tim Holloway; John Hudson (10 February 2003), Proposal to change character properties of ARABIC SIGN SAFHA (英語) | |||
L2/06-332 | Behdad Esfahbod; Roozbeh Pournader (15 October 2006), Proposal to change the Bidi category of five Arabic characters from AL to AN (英語) | |||
U+0615 | 1 | L2/03-154 | Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語) | |
U+0658 | 1 | L2/98-409 | Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語) | |
L2/02-021 | Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語) | |||
L2/09-176 | Muzaffar Aazim; Kamal Mansour; Roozbeh Pournader (2 May 2009), Proposal to add two Kashmiri characters and one annotation to the Arabic block (英語) | |||
L2/12-381 | Roozbeh Pournader (5 November 2012), Initial and medial forms of Arabic Letter Noon Ghunna (英語) | |||
4.1 | U+065A..065C | 3 | L2/98-409 | Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語) |
L2/02-021 | Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語) | |||
L2/03-154 | Jonathan Kew (16 May 2003), Proposal to encode productive Arabic-script modifier marks (英語) | |||
L2/03-168 | Jonathan Kew (30 May 2003), Proposal to encode Arabic-script letters for African languages (英語) | |||
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
L2/09-406 | India NB (1 November 2009), Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686) (英語) | |||
U+061E | 1 | L2/03-159 | Jonathan Kew (29 May 2003), Proposal to encode Arabic triple dot punctuation mark (英語) | |
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
U+0659 | 1 | L2/03-133 | Michael Everson; Roozbeh Pournader (29 May 2003), Proposal to encode the ARABIC ZWARAKAY (英語) | |
L2/03-210 | Jonathan Kew (12 June 2003), Draft chart showing UTC #95 additions to Arabic blocks (英語) | |||
L2/03-223 | Jonathan Kew (11 July 2003), Proposal to encode additional Arabic script characters (8.5mb) (英語) | |||
U+065D..065E | 2 | L2/04-025 | Jonathan Kew (21 January 2004), Proposal to encode 5 new Arabic script characters [WG2-N2723] (英語) | |
5.1 | U+0606..060A | 5 | L2/05-320 | Azzeddine Lazrek (24 October 2005), Arabic Mathematical Diverse Symbols (amds4l.pdf) (英語) |
U+0616,063B..063F | 6 | L2/06-345 | Michael Everson; Roozbeh Pournader; Elnaz Sarbar (8 November 2006), Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised) (英語) | |
U+0617..061A | 4 | L2/06-358 | Michael Everson; Roozbeh Pournader (8 November 2006), Proposal to encode four Qur'anic Arabic characters in the UCS (WG2 N3185R - Revised) (英語) | |
6.0 | U+0620,065F | 2 | L2/98-409 | Mark Davis; Kamal Mansour (1 December 1998), Proposal to add 25 Arabic characters to the BMP (英語) |
L2/02-021 | Kamal Mansour (17 January 2002), Proposal to amend Arabic repertoire (英語) | |||
L2/09-176 | Muzaffar Aazim; Kamal Mansour; Roozbeh Pournader (2 May 2009), Proposal to add two Kashmiri characters and one annotation to the Arabic block (英語) | |||
L2/10-169 | Swaran Lata (6 May 2010), Comments on the Proposed Arabic Letter Kashmiri Yeh (英語) | |||
6.1 | U+0604 | 1 | L2/09-144 | Anshuman Pandey (22 January 2010), Proposal to Encode the Samvat Date Sign for Arabic (revision 3; WG2 N3734) (英語) |
6.3 | U+061C | 1 | L2/11-005 | Matitiahu Allouche; Mohamed Mohie (17 January 2011), Proposal to encode an Arabic-Letter Mark (ALM) (英語) |
L2/11-278 | Matitiahu Allouche; Mohamed Mohie (20 July 2011), Proposal to encode an Arabic-Letter Mark (ALM) (replaces L2/11-005) (英語) | |||
L2/11-432 | Mohamed Mohie (15 February 2012), Revised Proposal for Arabic Letter Mark (英語) | |||
L2/13-040 | Roozbeh Pournader; Aharon Lanin (30 January 2013), Fasttracking Arabic Letter Mark (ALM) (英語) | |||
L2/16-306 | Peter Constable (28 October 2016), Script property of Arabic Letter Mark and interaction with digit substitution mechanisms (英語) | |||
14.0 | U+061D | 1 | L2/20-245 | Khaled Hosny; Roozbeh Pournader (28 September 2020), Proposal to encode three Arabic symbols (英語) |
|
出典
[編集]- ^ “3.8: Block-by-Block Charts”. The Unicode Standard. Unicode Consortium. 2024年2月2日閲覧。
- ^ a b c d e f g h i j k l m n Jonathan Kew; SIL (2001年11月1日). “Proposal to add Arabic-script honorifics and other marks” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b c d e f g h i j Jonathan Kew; SIL (2001年11月1日). “Proposal to add Arabic-script honorifics and other marks, Appendix: Examples of usage (14.5 MB)” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b Anshuman Pandey (2010年1月22日). “Proposal to Encode the Samvat Date Sign for Arabic (revision 3; WG2 N3734)” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b Jonathan Kew (2002年2月6日). “Bidi committee consensus on Arabic additions from L2/01-425” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl cm cn co cp cq cr cs ct cu cv cw cx cy cz da db dc dd de df dg dh di dj dk dl dm dn do dp dq dr ds dt du dv dw dx dy dz ea eb ec ed ee ef eg eh ei ej ek el em en eo ep eq er es et eu ev ew ex ey ez fa fb fc fd fe ff fg fh fi fj fk fl fm fn fo fp fq fr fs ft fu fv fw "The Unicode Standard, Version 15.1 - U0600.pdf" (PDF). The Unicode Standard (英語). 2024年2月9日閲覧。
- ^ a b c d e f Azzeddine Lazrek (2005年10月24日). “Arabic Mathematical Diverse Symbols (amds4l.pdf)” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c d e f Paul Nelson (2000年4月7日). “Proposal to add Urdu Epethit and Abbreviation Diacritics to the Arabic Block” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b c d e f g h i j k l Michael Everson; Roozbeh Pournader, Elnaz Sarbar (2006年11月8日). “Proposal to encode eight Arabic characters for Persian and Azerbaijani (WG2 N3180R - Revised)” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c d e Michael Everson; Roozbeh Pournader (2006年11月8日). “Proposal to encode four Qur'anic Arabic characters in the UCS (WG2 N3185R - Revised)” (英語). Unicode. 2024年2月10日閲覧。
- ^ Matitiahu Allouche; Mohamed Mohie (2011年7月20日). “Proposal to encode an Arabic-Letter Mark (ALM) (replaces L2/11-005)” (英語). Unicode. 2024年2月10日閲覧。
- ^ Khaled Hosny; Roozbeh Pournader (2020年9月28日). “Proposal to encode three Arabic symbols” (英語). Unicode. 2024年2月10日閲覧。
- ^ Jonathan Kew (2003年5月29日). “Proposal to encode Arabic triple dot punctuation mark” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c d e Thomas Milo (2001年8月17日). “Comments on the Arabic block in Unicode” (英語). Unicode. 2024年2月11日閲覧。
- ^ Michael Everson; Roozbeh Pournader (2003年5月29日). “Proposal to encode the ARABIC ZWARAKAY” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c India NB (2009年11月1日). “Proposal to add one character in the Arabic block for representation of Kashmiri and annotation of existing characters (WG2 N3686)” (英語). Unicode. 2024年2月10日閲覧。
- ^ Denis Moyogo Jacquerye (2020年5月13日). “Proposal to encode Bosnian Arabic characters” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b c Jonathan Kew (2004年1月21日). “Proposal to encode 5 new Arabic script characters [WG2-N2723]” (英語). Unicode. 2024年2月10日閲覧。
- ^ Paul Nelson; Assem Hijazi, Aiman Copty (2000年4月7日). “Proposal to change glyph shape for U+066C ARABIC THOUSAND SEPARATOR” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b Mark Davis; Kamal Mansour (2000年10月12日). “Proposal for addition to Arabic repertoire” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b Unicode Consortium; SC2/WG2 N2357 (2001年4月4日). “Proposal to encode two Arabic characters to the UCS” (英語). Unicode. 2024年2月10日閲覧。
- ^ a b 原文:"Maghrib Arabic"。恐らくアラビア語モロッコ方言、アラビア語サハラ方言、アラビア語アルジェリア方言、アラビア語チュニジア方言、アラビア語リビア方言を纏めた呼称だと思われる。
- ^ a b c Marc Lodewijck (2019年1月2日). “Comments on three Arabic-derived letters” (英語). Unicode. 2024年2月10日閲覧。
- ^ Roozbeh Pournader (2009年4月16日). “Moving dots and Arabic script shaping: Farsi Yeh’s and Jawi Nya” (英語). Unicode. 2024年2月10日閲覧。
- ^ Thomas Milo (2001年8月14日). “Variants in Arabic script – related to L2/01-304” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b c Jonathan Kew; SIL (2001年11月1日). “Proposal to add Parkari letters to Arabic block (1.6 MB)” (英語). Unicode. 2024年2月11日閲覧。
- ^ a b c Aleem Qureshi (2021年4月21日). “Missing Urdu digits 4, 6 and 7” (英語). Unicode. 2024年3月4日閲覧。