ISO/IEC 8859-6
ISO/IEC 8859-6:1999 ISO 8859の第6部であり、ラテン文字とアラビア文字用の文字コードの標準である。1987年に初版が制定された。アラビア語以外の、ペルシャ語やウルドゥー語用の文字は含まれておらず、実質アラビア語以外の言語を記すことは出来ない。
概要
[編集]もともと MS-DOS のコードページとして作られた ASMO-708[1] から罫線素片などのアラビア語と無関係な文字を除外したものである。
文字表には独立形のみが書かれているが、この文字コードで書かれたテキストを表示するにはアラビア語の結合処理が必要である。また、シャクルは結合文字として処理されなければならない。
数字はASCIIの数字のみが定義されている。
ISO_8859-6:1987 (その推奨MIME名であるISO-8859-6のほうが有名) はこの規格を (RFCには視覚 (左から右) 順序と記述されているにもかかわらず) 論理順序で使ったものと、C0 (0x00–0x1F) とC1 (0x80–0x9F) 部にISO/IEC 6429からの制御符号を使ったものからなるIANAキャラクタセットである。(ISO/IEC 6429やISO/IEC 2022からの) エスケープシーケンスは解釈されない。このキャラクタセットのテキストは論理順序なので、表示には双方向テキスト処理が必要である。このキャラクタセットにはiso-ir-127、ISO_8859-6、ECMA-114、ASMO-708、ArabicおよびcsISOLatinArabicという別名がある。
名前の後ろに -e や -i を付けることによって、明示的もしくは暗黙に書字方向を指定したバージョンも存在する[2]。ISO-8859-6-I は暗黙の(論理的)書字方向を持ち、ISO-8859-6-E は制御符号を使って明示的に書字方向を指定する必要がある。何もつけない ISO-8859-6 では左から右へ表示されることになっているが、現実には ISO-8859-6-E は使用されず、ISO-8859-6 は ISO-8859-6-I と同様に扱われる。
符号表
[編集]ISO/IEC 8859-6 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | 未使用 | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | 未使用 | |||||||||||||||
9x | ||||||||||||||||
Ax | NBSP | ¤ | ، | SHY | ||||||||||||
Bx | ؛ | ؟ | ||||||||||||||
Cx | ء | آ | أ | ؤ | إ | ئ | ا | ب | ة | ت | ث | ج | ح | خ | د | |
Dx | ذ | ر | ز | س | ش | ص | ض | ط | ظ | ع | غ | |||||
Ex | ـ | ف | ق | ك | ل | م | ن | ه | و | ى | ي | ً | ٌ | ٍ | َ | ُ |
Fx | ِ | ّ | ْ |
上記の表で、20は通常のSPACE文字で、A0はNO-BREAK SPACEである。ADはSOFT HYPHENで、適合するWebブラウザでは何も表示されるべきでない。
符号値 0x00–0x1F, 0x7F, 0x80–0x9F, 0xA1–0xA3, 0xA5–0xAB, 0xB0–0xBA, 0xBC–0xBE, 0xC0, 0xDC–0xDF, および 0xF3–0xFF には、ISO/IEC 8859-6では文字が割り当てられていない。
符号値 0xEB–0xF2 には結合文字が割り当てられている。
脚注
[編集]- ^ Microsoft. “Code Page 708 MS-DOS Arabic ASMO”. 2013年10月10日閲覧。
- ^ RFC 1556 Handling of Bi-directional Texts in MIME
外部リンク
[編集]- ISO/IEC 8859-6:1999 (英語)
- Standard ECMA-114: 8-Bit Single-Byte Coded Graphic Character Sets - Latin/Arabic Alphabet 2nd edition (2000年12月) (英語)
- ISO-IR 127 Right-Hand Part of Latin/Arabic Alphabet (1986年11月30日) (英語)