コンテンツにスキップ

英文维基 | 中文维基 | 日文维基 | 草榴社区

利用者:Hatukanezumi/JIS X 4051の字間空き量/その他の文字の分類

詳細は親ページを参照。

表5a ウィキペディア日本語版に即した文字の分類 (その他)
分類 文字
(Yw) その他 (和字)
℡ ℻
Ⅰ-Ⅻ ⅰ-ⅻ

☖ ☗ ♨
⦿ ⧺ ⧻
U+2E80-U+2FFF
〃 〄 々 〆 〇 〒 〓 〠 〡-〩
〪- 〯
〰 〱 〲 〶 〷 〸-〺 〻 〼 〽 〾 〿
ぁ-ゟ
ァ-ヺ ー-ヿ
㆐-㆟
U+31C0-U+31EF
ㇰ-ㇿ
㈠ -㉃ ㊀-㊰ ㋐-㋾
㌀-㍗ ㍻-㍾ ㍿
U+3400-U+4DBF
䷀-䷿
U+4E00-U+9FFF
U+F900-U+FAFF
﹅ ﹆
U+20000-U+2FFFD
(Yx) その他 (両方)

& * + / < = > @ \ |
§ © ¬ ® ± ¶ ¼ ½ ¾ × ÷
‖ † ‡ • ⁂ ⁑
⅓-⅟
←-⇿
⌅ ⌆ ⌒ ⌘ ⏎
U+2400-U+243F
①-⓿
■ □ ▱ ▲ △ ▶ ▷ ▼ ▽ ◀ ◁ ◆ ◇ ○ ◎ ● ◐ ◑ ◒ ◓ ◦ ◯
☀ ☁ ☂ ☃ ★ ☆ ☎ ☞ ♀ ♂ ♠-♧ ♩-♯
U+2700-U+27BF
⤀-⥿
U+2B00-U+2BFF
㉑-㉟ ㊱-㊿

(Yn) その他 (欧文用)

-
" ' 0-9 A-Z ^ _ ` a-z ~
(U+00A0 ノンブレークスペース)
¡ ¤ ¦ ¨ ª ­ ¯ ² ³ ´ · ¸ ¹ º ¿ À-Ö Ø-ö ø-ÿ
U+0100-U+10FF
U+1200-U+1FFF
‸ ‽-⁁ ⁊-⁐ ⁒-⁞
℀-ℂ ℄-℈ ℊ-ℒ ℔ ℕ ℗-℠ ™-℺ ℼ-⅏
U+216C-U+216F U+217C-U+218F
U+2C00-U+2DFF
U+2E00-U+2E7F
U+A500-U+AA5F
U+FB00-U+FDFF
U+FE70-U+FEFF
U+10000-U+1FFFD

  • 「その他-和字」に次のものを追加して、「(Yw) その他 (和字)」とした。
    • U+213B ℻ JIS X 0213には見えない。なお ℡ ℻ はjaWPで使用を推奨されない。
    • CJK部首補足、康熙部首、Ideographic Description Characters、漢文、CJK字画、の各ブロック。
    • Enclosed CJK Letters and Monthsブロックのうち、和字を含むもの。ただし、これらはjaWPでは使用を推奨されない。
    • CJK symbols and punctuationのブロックのうち、他の欄に含まれないもの (和字間隔を除く)。なお、
      • U+3004 〄 日本工業規格記号 - 常に和字としてふるまうのかどうかは疑問である。
      • U+3021-U+3029, U+3038-U+303A 蘇州号碼 - 漢字に準ずるものとして和字に加えた。
      • U+303E 〾 IDEOGRAPHIC VARIATION INDICATORは、jaWPでは使うべきでないだろう。
    • 濁点と半濁点 (結合文字とそうでない文字)。゙ ゚ ゛ ゜
    • U+3300-U+33FF CJK Compatibilityブロックのうち、和字を含むもの。ただし、これらはjaWPでは使用を推奨されない。
    • U+3400-U+4DBF CJK統合漢字拡張Aすべて。
    • U+4DC0-U+4DFF 易経64卦。䷀-䷿
    • U+4E00-U+9FFF CJK統合漢字すべて。
    • U+F900-U+FAFF CJK互換漢字すべて。
    • U+20000-U+2FFFD 追加漢字面すべて (CJK統合漢字拡張B、CJK互換漢字補足)。
  • 「その他-両方」に次のものを追加して、「(Yx) その他 (両方)」とした。
    • U+2153-U+215F Number Formsのうち、分数すべて。
    • U+2190-U+21FF, U+2900-U+297F 矢印すべて。
    • U+2400-U+243F Control Picturesすべて。
    • U+2460-U+24FF 囲み英数字のすべて。ただしjaWPでは使用を推奨しないと考えられる (WP:JPE#丸付き数字参照)。
    • U+2700-U+27BF Dingbats
    • U+2B00-U+2BFF その他の記号と矢印
  • 「その他-欧文中の文字」に次のものを追加して、「(Yn) その他 (狭)」とした。
    • U+0100-U+10FF, U+1200-U+1FFF 主な現用の音素文字、音声記号、ダイアクリティカルマーク。
    • U+2038 ‸ CARET、U+203D ‽ INTERROBANG。欧文約物と考えられるが、組版規則は明確ではない。
    • ⁀ ⁁ ⁊ ⁋ ⁌ ⁍ ⁎ ⁏ ⁐。UAX #14の属性ALである。
    • ⁒ ⁓ ⁔ ⁕ ⁖ ⁗ ⁘ ⁙ ⁚ ⁛ ⁜ ⁝ ⁞。ALかBAだが組版規則が明らかでないのでいずれも約物としない。
    • U+2100-U+214F Letterlike Symbols。ただし ℃ ℉ ℓ № ℡ ℻ を除く。
    • U+216C-U+216F, U+217C-U+218F Number Formsブロックのうち、ローマ数字の大数および古形。ただし、jaWPではラテン文字と同字形のものはラテン文字で表記することを推奨している (WP:JPE#ローマ数字参照)。
    • 2C00-U+2DFF グラゴル文字、ラテン文字拡張C、コプト文字、グルジア文字追加、ティフナグ文字、エチオピア文字追加、キリル文字拡張A
    • U+2E00-U+2E7F 追加句読点。組版規則が明らかでないので、約物としない。
    • U+A500-U+AA5F ヴァイ文字、キリル文字拡張B、Modifier Tone Letters、ラテン文字拡張D、Syloti Nagri、パスパ文字、サゥラーシュトラ文字、Kayah Li、ルジャン文字、チャム文字。
    • U+FB00-U+FDFF Alphabetic Presentation Forms, Arabic Presentation Forms-A。正規化されるべき。
    • U+FE70-U+FEFF Arabic Presentation Forms-B。正規化されるべき。
    • U+10000-U+1FFFD 追加多言語面すべて。ただし、U+1F000-U+1F02F 麻雀牌と、U+1F030-U+1F09F ドミノの駒が、常に欧文用文字としてふるまうかどうかは疑問である。
    • 以上の中には「欧文用文字」とは言えないものもあるが、和字とともに現れることが原則としてないため欧文として扱う。また、文字体系独自の約物を含んでいる場合があるが、その組版規則はここでは扱いきれないので、他の文字と区別せず扱う。
  • 次のブロックの文字は、「(Yw) その他 (和字)」と「(Yn) その他 (欧文用)」のどちらに属するか判断しかねるため、上表には含まれていない。
    • U+1100-U+11FF ハングル字母
    • U+2200-U+22FF 数学演算子。JISでは一部が「その他-両方」と「その他-欧字」にあるが、区別の意図がよくわからない。したがって、表からこれらを除いた。
    • U+2300-U+23FF Miscelaneous Technical。ただし ⌅ ⌆ ⌒ ⌘ ⏎ を除く。雑多な約物類なので精査が困難。JISの歯科用罫線素片はこのブロックにある。
    • U+2440-U+245F 光学文字認識 (OCR)
    • U+2500-U+257F, U+2580-U+259F 罫線素片、地紋
    • U+2600-U+26FF, U+2980-U+29FF, U+2A00-U+2AFF 数学記号のうち、表中にないもの。すべて「その他 (両方)」としてもよいようにも思われる。
    • U+2800-U+28FF 点字。
    • U+3100-U+312F 注音字母
    • U+3130-318F ハングル互換字母
    • U+31A0-U+31BF 注音字母拡張
    • U+3200-U+321E Enclosed CJK Letters and Monthsのうち、ハングルを含むもの。
    • U+3250 同じく、PARTNERSHIP SIGN。㉐
    • U+32C0-U+32CB 同じく、電報用月記号。
    • U+32CC-U+32CF 同じく、ラテン文字組文字 (jaWPではラテン文字表記の単位記号として扱うべき)。㋌ ㋍ ㋎ ㋏
    • U+3358-U+3370 CJK Compatibilityのうち、電報用時記号。
    • U+3371-U+337A, U+3380-U+33DF, U+33FF 同じく、ラテン文字組文字。jaWPではラテン文字表記の単位記号として扱うべき。したがって、㎎ ㎏ ㎜ ㎝ ㎞ ㎡ ㏄ ㏍ は和字から除いた。
    • U+33E0-U+33FE 同じく、電報用日記号。
    • U+A000-U+A4BF, U+A490-U+A4CF 彝文字音節、彝文字部首
    • U+AC00-U+D7AF ハングル音節
    • U+FE00-FE0F Variation Selectors
    • U+FFFC OBJECT REPLACEMENT CHARACTER
    • U+FFFD REPLACEMENT CHARACTER