コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

MacJapanese

出典: フリー百科事典『ウィキペディア(Wikipedia)』

MacJapaneseまたはMac OS Japaneseは、AppleShift_JISを独自に拡張した文字コードである。

主にClassic Mac OSのバージョン 7.1からバージョン 9.xまでの間で利用された。

対応する文字コード

[編集]

MacJapaneseはIANAによって登録されていない。そのためRFC 2045§ 6.3に従って、XMLMIMEなどでは "x-Mac-Japanese" という文字列がこの文字コードの名前として使われている(Apple製であるiPodもこの名前を認識する[1])。

また、MacJapaneseをUnicodeにマッピング(対応付け)した上で、Unicode用の文字符号化方式UTF-16UTF-8など)を使って符号化する方法もあり、macOSのファイル名などにはこの方法が使われている。ただし、MacJapanese固有の文字を私用領域 (Private Use Area) のU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使って表現するので、macOS以外の環境との互換性は無い。

歴史

[編集]

文字セット

[編集]

以下、「0x」を数字の先頭に付けた十六進法表記を用いて各文字のコードを表す。

1バイト

[編集]

0x00から0x7Fまでと0xA1から0xDFまでの部分(いわゆる半角文字の部分)はJIS X 0201に準ずる。ただし0x7EにはASCIIに倣ってU+7Eのチルダが割り当てられている。

次の記号が追加されている。

  • 0x80 …… U+5C reverse solidus (= backslash)、半角バックスラッシュ\」(ASCII の0x5Cと同じ)
  • 0xA0 …… U+A0 no-break space、ノーブレークスペース (NBSP)
  • 0xFD …… U+A9 copyright sign、著作権記号©」(○で囲まれた「C」)
  • 0xFE …… U+2122 trade mark sign、商標記号「」(「TM」)
  • 0xFF …… halfwidth horizontal ellipsis、半角の欧文用三点リーダー(半角幅の「...」)

2バイト

[編集]

2バイトで表される文字(いわゆる全角文字)は、JIS X 0208-1990 を基にしている。さらに0x8540から0x886Dに「Apple標準システム外字」(記号など)が、0xEB41から0xED96までに縦書き用の文字が追加されている。Apple標準システム外字のうちUnicodeに対応している文字には次のようなものがある。

Apple標準システム外字

[編集]
丸附き数字・黒丸附き数字
文字 内容   文字 内容   文字 内容
○で囲まれた1   ○で囲まれた11   ●で囲まれた白抜きの1
○で囲まれた2 ○で囲まれた12 ●で囲まれた白抜きの2
○で囲まれた3 ○で囲まれた13 ●で囲まれた白抜きの3
○で囲まれた4 ○で囲まれた14 ●で囲まれた白抜きの4
○で囲まれた5 ○で囲まれた15 ●で囲まれた白抜きの5
○で囲まれた6 ○で囲まれた16 ●で囲まれた白抜きの6
○で囲まれた7 ○で囲まれた17 ●で囲まれた白抜きの7
○で囲まれた8 ○で囲まれた18 ●で囲まれた白抜きの8
○で囲まれた9 ○で囲まれた19 ●で囲まれた白抜きの9
○で囲まれた10 ○で囲まれた20  
丸括弧附き数字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(1)   (5)   (9)   (13)   (17)
(2) (6) (10) (14) (18)
(3) (7) (11) (15) (19)
(4) (8) (12) (16) (20)
ドット附き数字
文字 表記   文字 表記   文字 表記
1.   4.   7.
2. 5. 8.
3. 6. 9.
大文字および小文字のローマ数字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
I   V   IX   i   v   ix
II VI X ii vi x
III VII XI iii vii xi
IV VIII XII iv viii xii
丸括弧附きアルファベット小文字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(a)   (e)   (i)   (m)   (q)   (u)   (y)
(b) (f) (j) (n) (r) (v) (z)
(c) (g) (k) (o) (s) (w)  
(d) (h) (l) (p) (t) (x)
単位記号
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
mm   cm   km2   ml   ms   °F   KB
mm2 cm2 mg dl μs mb MB
m2 cm3 kg l ns HP GB
m3 km cc kl ps Hz  
アルファベットの組文字
文字 表記   文字 表記   文字 表記
No.   K.K.   TEL
スート(トランプ記号)
文字 内容   文字 内容
スペード記号   白抜きスペード記号
ハート記号 白抜きハート記号
ダイヤ記号 白抜きダイヤ記号
クローバー記号 白抜きクローバー記号
その他記号[疑問点]
文字 内容   文字 内容   文字 内容
顔郵便マーク   黒電話   JISマーク
矢印記号
文字 内容   文字 内容   文字 内容
指さし矢印上   白抜き矢印上   ↑↓
指さし矢印下 白抜き矢印下
指さし矢印左 白抜き矢印左
指さし矢印右 白抜き矢印右  
丸括弧附き漢字
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
(日)   (金)   (至)   (名)   (特)
(月) (土) (代) (有) (監)
(火) (祭) (呼) (学) (企)
(水) (祝) (株) (財) (協)
(木) (自) (資) (社) (労)
囲み文字
文字 内容   文字 内容   文字 内容   文字 内容
○で囲まれた上   ○で囲まれた左   ○で囲まれた財   ○で囲まれた印
○で囲まれた中 ○で囲まれた右 ○で囲まれた優 ○で囲まれた秘
○で囲まれた下 ○で囲まれた医 ○で囲まれた労  
組文字
文字 表記   文字 表記   文字 表記   文字 表記
ミリ   ヘクタール   ミリバール   ハイツ
キロ リットル ページ ビル
センチ ワット アパート フィート
メートル カロリー インチ ヘルツ
グラム ドル キログラム ホーン
トン セント キロメートル マンション
アール パーセント コーポ ヤード
株式会社  
数学記号
文字 内容   文字 内容   文字 内容
閉曲線積分
(閉路積分・周回積分)記号
  直角記号   直角三角形
引用符
文字 内容   文字 内容
始めダブルミニュート
日本語用の「“」
  終わりダブルミニュート
日本語用の「”」
濁点附きのひらがな・カタカナ
文字 表記   文字 表記   文字 表記   文字 表記   文字 表記
う゛   ワ゛   ヰ゛   ヱ゛   ヲ゛

縦書き用の文字

[編集]

縦書き用文字には、括弧などの記号を回転させたものと、句読点小書きの仮名を右上に寄せたものがある。「」(二点リーダ)、「」(三点リーダ)、「」「」(括弧)、「」「」(すみ付き括弧)など。三点リーダは U+FE19 に収録されているが、MacJapaneseのコードポイントとは異なり、互換性はない。

これらは、DTPなどの縦書きに対応したアプリケーションで縦書き表示をする際に、本来の文字コードを変換してQuickDrawの描画APIに渡すために使われたものである。通常、情報交換に使われることはない。

他の文字コードとの対応

[編集]

全角文字に関しては、縦書き用文字を別にすると、次のように区分できる。

区分1

[編集]

NEC特殊文字にある文字。73字。

シフト符号化表現で符号化すると、MacJapaneseと Windows-31JShift_JIS-2004 とでは別のコードポイントが与えられているために、機種依存文字として文字化けの原因となる。例えば「」(○で囲まれた「12」)は Windows-31J や Shift_JIS-2004 では 0x874B に割り当てられているが、MacJapanese においては 0x874B に「」(「(代)」)が割り当てられているといった具合である。Unicode においては同じコードポイントが与えられているため、文字化けは発生しない。

区分2

[編集]

NEC特殊文字になく、JIS X 0213 にはある文字。53字。

区分1と同じく、Shift_JIS-2004 で表現するとMacJapaneseとは別のコードポイントが割り当てられているため、文字化けの原因となる。

区分3

[編集]

NEC特殊文字にも JIS X 0213 にもなく、Unicodeにはある文字。109字。

Unicodeのエンコーディング(UTF-16UTF-8など)を用い、対応する文字のグリフが存在するフォントを利用すれば、正常に情報交換することができる。仮にMacJapaneseを用いて情報交換し、Unicode に変換しようとした場合には、「Unicode と MacJapanese の変換テーブル」を使わないと変換することができない。

区分4

[編集]

NEC特殊文字にも JIS X 0213 にもUnicodeにもないが、Unicodeでは文字合成で表せる文字。3字。

囲み文字であり、記号用ダイアクリティカルマークU+20DDを用いた文字合成で表現するか、CSSOpenType feature tag で表現する。そのため、対応していないOS・フォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示される[2]。文字一覧を下記に記す。文字のうち、左は文字合成、右はCSSの OpenType feature tag を使用したもの。

文字 Unicode 内容   文字 Unicode 内容   文字 Unicode 内容
大⃝ U+5927
U+20DD
○で囲まれた大[2]   小⃝ U+5C0F
U+20DD
○で囲まれた小[2]   控⃝ U+63A7
U+20DD
○で囲まれた控[2]

区分5

[編集]

NEC特殊文字にも JIS X 0213 にもUnicodeにもないが、同型・同用途の文字がUnicodeにある文字。7字。

Unicodeのエンコーディングと対応するフォントを用いて情報交換することはできるが、コードポイントは別であり[疑問点]、MacJapanese との互換性はない[3]。なお、MacJapanese で入力[4]した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。文字が2種類あるものは、左はUnicode、右はCSSの OpenType feature tag を使用したもの。

文字 Unicode 内容   文字 Unicode 内容・表記
U+2B06 黒塗り矢印上[3]   🄀 0 U+1F100 0.[3]
U+2B07 黒塗り矢印下[3] FAX U+213B 組文字・FAX[3]
U+2B05 黒塗り矢印左[3] U+21F5 ↓↑[5]
U+27A1 黒塗り矢印右[3]

区分6

[編集]

NEC特殊文字にも JIS X 0213 にもUnicodeにもないが、同型の別字が JIS X 0213 やUnicodeにある文字[疑問点]。2字。

区分5と同様に、別のコードポイントに同型の文字があるもの。この同型の文字は、MacJapaneseおよびJIS X 0213やUnicodeに収録されている。共に全角ラテン文字と同型。なお、MacJapanese で入力した場合に Unicode へ変換するならば区分7に準ずる。Unicode のコードポイントにある同型の文字一覧を下記に記す。

文字 Unicode 内容 (mac) 内容 (Unicode)   文字 Unicode 内容 (mac) 内容 (Unicode)
U+217F メートル記号 ローマ数字小文字1000   U+210A グラム記号 スクリプト体小文字g(実数記号)

区分7

[編集]

NEC特殊文字にも JIS X 0213 にもUnicodeにもなく、同型・同用途の文字もUnicodeにない文字。9字。

文字合成を行なったり異体字タグを利用したりして表現することになる。そのためにUnicodeの私的領域であるU+F860、U+F861、U+F862、U+F87A、U+F87E、U+F87Fを使っている。したがって、MacJapaneseに対応していないフォントやアプリケーションで表示しようとしても、合成されるべきところが合成されずに表示されたり、異体字となったりする[4]。記号一覧を下記に記す。記号が2種類あるものは、右はCSSの OpenType feature tag を使用したもの。

記号 Unicode表記 内容   記号 Unicode表記 内容   記号 Unicode表記 内容
有限会社 U+F862
U+6709
U+9650
U+4F1A
U+793E
組文字・有限会社   XIII U+F862
U+0058
U+0049
U+0049
U+0049
ローマ数字13大文字   xiii U+F862
U+0078
U+0069
U+0069
U+0069
ローマ数字13小文字
財団法人 U+F862
U+8CA1
U+56E3
U+6CD5
U+4EBA
組文字・財団法人 XIV U+F861
U+0058
U+0049
U+0056
ローマ数字14大文字 xiv U+F861
U+0078
U+0069
U+0076
ローマ数字14小文字
TB TB U+F860
U+0054
U+0042
単位・テラバイト XV U+F860
U+0058
U+0056
ローマ数字15大文字 xv U+F860
U+0078
U+0076
ローマ数字15小文字

macOS での対応

[編集]

macOSにおいては、MacJapaneseは「Shift_JIS (Mac)」(文字パレット)あるいは「日本語 (Mac OS)」(テキストエディット)と表現される。

また、macOS附属のフォントではOsakaのみがMacJapaneseに完全対応している。ヒラギノはUnicodeとAdobe-Japan1文字コレクションに対応しているため、Unicodeを扱えるアプリケーション上ではUnicodeに対応する文字が存在しない18字(上記の区分5〜7)を除いてMacJapaneseの文字を表示できる。一方、CID を扱えるアプリケーション上でヒラギノを使う場合には、halfwidth horizontal ellipsis (半角三点リーダー)以外の文字を全て表示できる。

iPod での対応

[編集]

脚注

[編集]
  1. ^ iPod 2.0: 日本語、韓国語、繁体字中国語、簡体字中国語で作成されたテキストファイルを表示する方法
  2. ^ a b c d Classic Mac OSmacOS であれば標準の環境なら正しく表示されるが、Windowsでは合成に対応したフォントが少ないのが現状。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシックProN」がダウンロード可能。他にも、にしき的フォントにある手書きのポップ体「Nishiki-teki」が対応している。
  3. ^ a b c d e f g UnicodeでARIB外字を扱えるフォントなどが表示に対応している。無料導入できるものは和田研フォントをベースにしたものがあり、和田研細丸ゴシック Wiki - SourceForge.JPの下部にて「和田研細丸ゴシック2004絵文字、和田研中丸ゴシック2004絵文字」がダウンロード可能。旧バージョンの「和田研細丸ゴシック2004ARIB、和田研中丸ゴシック2004ARIB」も対応。
  4. ^ a b macOSでは通常の変換でリストに出てこないため、過去の文章との互換性を保つ目的と思われる。
  5. ^ 無料で導入できるフォントで表示に対応しているものは、Y.Oz Voxにある「YOzFont」や、Unicodeフォントの「Code2000」、にしき的フォントにある手書きのポップ体「Nishiki-teki」などがある。

関連項目

[編集]

外部リンク

[編集]