マイクロソフト標準キャラクタセット
マイクロソフト標準キャラクタセット(マイクロソフトひょうじゅんキャラクタセット)は、Windowsにおいて特別なフォントを自前で用意することなく表示できる日本語の文字集合のことである。Windows 3.1にて搭載された。『Windows-31J』に登録された全文字を実装している。
Windows 98、Windows NT 4.0(SP4以降) に搭載されたフォントでは『マイクロソフト標準キャラクタセット』に加え、『JIS X 0212』(補助漢字 5801 文字)と『JIS X 0221追加非漢字集合』(1913 文字)を実装している[1]。
Windows Vistaでは、上記すべてに加えて『JIS X 0213:2004』が実装された。JIS X 0213:2004の規格票で例示字形が変更されたものに関しては、同様に変更された[2]。Windows Server 2008でも同様の変更が行われた。[3]
文字符号化方式について
[編集]『マイクロソフト標準キャラクタセット』を表現するための符号化方式としては、Shift_JIS、拡張EUC-JP、拡張ISO-2022-JPが利用できる。これらを使って符号化したもの(符号化文字集合)については、それぞれ、CP932、CP51932、CP50220というコードページ番号がついている。
通用日本文字集合
[編集]一覧
[編集]通用日本文字集合の内、基本日本文字集合以外の一覧。
―№℡ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩⅰⅱⅲⅳⅴⅵⅶⅷⅸⅹ∑∟∥∮⊿①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳〝〟㈱㈲㈹㊤㊥㊦㊧㊨㌃㌍㌔㌘㌢㌣㌦㌧㌫㌶㌻㍉㍊㍍㍑㍗㍻㍼㍽㍾㎎㎏㎜㎝㎞㎡㏄㏍丨仡仼伀伃伹佖侊侒侔侚俉俍俿倞倢偀偂偆偰傔僘僴兊兤冝冾凬刕劜劦劯勀勛匀匇匤卲厓厲叝咊咜咩哿喆坙坥垬埇埈增墲夋奓奛奝奣妤妺孖寀寘寬尞岦岺峵崧嵂嵓嵭嶸嶹巐弡弴彅彧德忞恝悅悊惕惞惲愑愠愰愷憘戓抦揵摠撝擎敎昀昉昕昞昤昮昱昻晗晙晥晳暙暠暲暿曺曻朎杦枻柀栁桄桒棈棏楨榘槢樰橆橫橳橾櫢櫤毖氿汜汯沆泚洄浯涇涖涬淏淲淸淼渧渹渼湜溿澈澵濵瀅瀇瀨炅炫炻焄焏煆煇煜燁燾犱犾猤獷玽珉珒珖珣珵琇琦琩琪琮瑢璉璟甁甯畯皂皛皜皞皦睆砡硎硤硺礰禔禛竑竧竫箞絈絜綠綷緖繒纊罇羡茁荢荿菇菶葈蒴蓜蕓蕙蕫薰蠇裵褜訒訷詹誧誾諟諶譓譿賰賴贒赶軏遧郞鄕鄧釗釚釞釤釥釭釮鈆鈊鈐鈹鈺鈼鉀鉎鉑鉙鉧鉷鉸銈銧鋐鋓鋕鋗鋙鋠鋧鋹鋻鋿錂錝錞錡錥鍈鍗鍰鎤鏆鏞鏸鐱鑅鑈閒隝隯霳霻靃靍靏靑靕顗顥餧馞驎髙髜魲魵鮏鮱鮻鰀鵫鵰鸙黑朗隆﨎﨏塚﨑晴﨓﨔凞猪益礼神祥福靖精羽﨟蘒﨡諸﨣﨤逸都﨧﨨﨩飯飼館鶴!"#$%&'()*+,-./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~。「」、・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚¢£¬ ̄¦¥
JIS X 0213、JIS X 0212に含まれない漢字
[編集]JIS X 0221:2007附属書JA「日本文字部分レパートリ」の内、通用日本文字集合(COMMON JAPANESE)にだけ含まれる漢字を下表に示す[4]。(JIS X 0213、JIS X 0212に含まれない漢字、包摂を考慮しない)
漢字 | Unicode | Shift-JIS (NEC選定IBM拡張文字) |
Shift-JIS (IBM拡張文字) |
関連する漢字 | 文字ソース |
---|---|---|---|---|---|
仼 | U+4EFC | ED4E | FA6A | 任 | GE-2151, T3-226E |
僴 | U+50F4 | ED60 | FA7C | GE-223E, H-97C4, T3-4574, K2-235F | |
凬 | U+51EC | ED66 | FA83 | 風 | G5-334A, T3-245B |
坙 | U+5759 | ED79 | FA96 | 巠 | GE-2553, T3-645F |
峵 | U+5CF5 | ED92 | FAAE | G5-3B35, H-8C48, T3-3062, K2-2E71 | |
悅 | U+6085 | EDA1 | FABD | 悦 | GE-2A29, HB1-AEAE, T1-5550, K0-666D, V1-5542 |
愠 | U+6120 | EDA5 | FAC1 | 慍 | G0-6333, HD-6120, T3-3B62 |
敎 | U+654E | EDB1 | FACD | 教 | GE-2C36, T3-3636, K0-4E67 |
昻 | U+663B | EDB4 | FAD0 | 昂 | GE-2C64, T3-2D22, K0-6469 |
櫢 | U+6AE2 | EDD6 | FAF2 | G5-457A, T3-5A48 | |
淲 | U+6DF2 | EDE5 | FB44 | G3-5459, HB2-D641, T2-3664, K2-4128 | |
淸 | U+6DF8 | EDE4 | FB43 | 清 | GE-3045, T3-367C, K0-7468 |
皂 | U+7682 | EE54 | FB70 | 皀 | G0-546D, HB1-A86D, T1-4B30, K6-102D |
蠇 | U+8807 | EE85 | FBA1 | 蠣 | GE-3C61, T3-5B29 |
赶 | U+8D76 | EE94 | FBB0 | 趕 | G0-384F, HB2-D3E3, T2-3327, K1-573E |
閒 | U+9592 | EECC | FBE8 | 間 | GE-4361, HB1-B6A2, T1-6267, K0-7959, V2-907C |
靑 | U+9751 | EED6 | FBF2 | 青 | GE-4468, H-8BC4, T3-2A7E, K0-746C |
髙 | U+9AD9 | EEE0 | FBFC | 高 | GE-464C, T4-362D |
﨎 | U+FA0E | ED73 | FA90 | G9-FE42, UTC-00843 | |
晴 | U+FA12 | EDBC | FAD8 | 晴 | UTC-00918 |
益 | U+FA17 | EE59 | FB75 | 益 | UTC-00921 |
礼 | U+FA18 | EE61 | FB7D | 礼 | G9-FE47, UTC-00922 |
靖 | U+FA1C | EE69 | FB86 | 靖 | UTC-00926 |
精 | U+FA1D | EE6C | FB89 | 精 | UTC-00927 |
羽 | U+FA1E | EE75 | FB92 | 羽 | UTC-00928 |
﨣 | U+FA23 | EE95 | FBB1 | G9-FE4B, JA-2728(Unified Japanese IT Vendors Contemporary Ideographs,1993), UTC-00850 | |
逸 | U+FA25 | EE98 | FBB4 | 逸 | UTC-00931 |
﨧 | U+FA27 | EEB7 | FBD3 | G9-FE4D, UTC-00852 | |
﨨 | U+FA28 | EEBE | FBDA | G9-FE4E, TF-584C, UTC-00853 | |
﨩 | U+FA29 | EECE | FBEA | G9-FE4F, UTC-00854 | |
飯 | U+FA2A | EEDA | FBF6 | 飯 | UTC-00933 |
飼 | U+FA2B | EEDB | FBF7 | 飼 | UTC-00934 |
館 | U+FA2C | EEDD | FBF9 | 館 | UTC-00935 |
鶴 | U+FA2D | EEEA | FC49 | 鶴 | UTC-00936 |
脚注
[編集]- ^ “[NT]NT4 SP4 での MS 明朝、MS ゴシック フォントの変更について”. Microsoft サポート. 2007年3月11日時点のオリジナルよりアーカイブ。2006年9月23日閲覧。
- ^ 鷹木 創 (2005年7月29日). “Windows VistaにJIS X 0213:2004対応の新日本語フォント「メイリオ」”. INTERNET Watch. 2006年9月23日閲覧。
- ^ Windows Vista/Windows Server 2008で従来のJIS90互換フォントを利用する - @IT
- ^ スラド COMMON JAPANESE にだけ含まれる漢字