-*- coding: utf-8 -*- あなたのUnicode処理系、ベンダごとに微妙に違う、いろんな変種に きちんと対応していますか? これは、そういう文字のテストシートです。�が出ていたらアウト。 とりあえず現在のバージョンでは、JISに関連しそうなもの限定。 $Id: UTFChecker.utf 1.3 2004/06/04 22:26:35 delmonta Exp $ ─────────────────────────────────────── ☆円記号とバックスラッシュをめぐる問題☆ \ 005C REVERSE SOLIDUS ¥ 00A5 YEN SIGN \ FF3C FULLWIDTH REVERSE SOLIDUS ¥ FFE5 FULLWIDTH YEN SIGN 【解説】 JISやIANAの規定に厳格に従うと、FULLWIDTHはできるだけ 使わないようにする、という規定により、 ①EUC-JPでは、5CはRSなのでA1EFがYEN、A1C0がFWRSと  なり、FWYSに対応する文字はない。 ②Shift_JISでは、5CはYENなので818FがFWYS、815FがRS、  FWRSは対応なし。 となるが、実際の各ベンダの実装は、 a)Apple Japaneseだと、5CがYEN、80がRSなので、818Fが  FWYS、815FがFWRS。ただし、MacOS Xでは必ずしも  そうではない模様。(調査中) b)WindowsやJavaでは、5C=RS、818F=FWYS、815F=FWRSと  している。Windowsの各種フォントで半角の円記号が表示されて  いても、内部的にはRSである。 文字 SJIS EUC MS Mac 005C 815F  5C  5C  80 00A5  5C A1EF -  5C FF3C - A1C0 815F 815F FFE5 818F - 818F 818F ─────────────────────────────────────── ☆かつては全角と半角があった文字☆ ¢ 00A2 CENT SIGN £ 00A3 POUND SIGN ¬ 00AC NOT SIGN ¢ FFE0 FULLWIDTH CENT SIGN £ FFE1 FULLWIDTH POUND SIGN ¬ FFE2 FULLWIDTH NOT SIGN 【解説】 IBMのメインフレームの中には、これらの記号を全角と半角の 両方で持っているものがあった(これが、OADGキーボードに 今も残るこれらの文字の刻印の由来)。OS/2を経てWindowsが 発展する中で、MSはUnicodeとメインフレームのコード(EBCDIC+ JIS X0208)との相互変換を考えたのか、FULLWIDTHを選択した。 文字 SJIS EUC MS Apple 00A2 - 8191 00A3 - 8192 00AC - 81CA FFE0 - - 8191 - FFE1 - - 8192 - FFE2 - - 81CA - ─────────────────────────────────────── ☆チルダ・オーバーライン問題☆ ~ 007E TILDE ‾ 203E OVERLINE 〜 301C WAVE DASH ~ FF5E FULLWIDTH TILDE  ̄ FFE3 FULLWIDTH MACRON 00AF MACRON FULLWIDTH MACRON SJIS EUC MS Mac 007E  7E 2015 301C - FF5E 8160 FFE3 8150 ─────────────────────────────────────── ☆矢印にもいろいろある☆ ← 2190 LEFTWARDS ARROW ↑ 2191 UPWARDS ARROW → 2192 RIGHTWARDS ARROW ↓ 2193 DOWNWARDS ARROW ↔ 2194 LEFT RIGHT ARROW ↕ 2195 UP DOWN ARROW ↖ 2196 NORTH WEST ARROW ↗ 2197 NORTH EAST ARROW ↘ 2198 SOUTH EAST ARROW ↙ 2199 SOUTH WEST ARROW ⟵ 27F5 LONG LEFTWARDS ARROW ⟶ 27F6 LONG RIGHTWARDS ARROW ⟷ 27F7 LONG LEFT RIGHT ARROW ⟸ 27F8 LONG LEFTWARDS DOUBLE ARROW ⟹ 27F9 LONG RIGHTWARDS DOUBLE ARROW ⟺ 27FA LONG LEFT RIGHT DOUBLE ARROW ⟻ 27FB LONG LEFTWARDS ARROW FROM BAR ⟼ 27FC LONG RIGHTWARDS ARROW FROM BAR ⟽ 27FD LONG L DOUBLE ARROW FROM BAR ⟾ 27FE LONG R DOUBLE ARROW FROM BAR ⟿ 27FF LONG RIGHTWARDS SQUIGGLE ARROW ← FFE9 HALFWIDTH LEFTWARDS ARROW ↑ FFEA HALFWIDTH UPWARDS ARROW → FFEB HALFWIDTH RIGHTWARDS ARROW ↓ FFEC HALFWIDTH DOWNWARDS ARROW SJIS EUC MS Mac 2190 81A9 2191 81AA 2192 81A8 2193 81AB ─────────────────────────────────────── ☆濁点の問題☆ が 304C HIRAGANA LETTER GA が 304B+3099 HL KA + COMBINING KATAKANA= HIRAGANA VOICED SOUND MARK ガ FF76+3099 HW KATAKANA LETTER KA + CKHVSM む゙ 3080+3099 HL MU + CKHVSM ※not even in Mac※ ム゙ FF91+3099 HWKL MU + CKHVSM ※ditto※ ゛ 309B KH VOICED SOUND MARK ゜ 309C KH SEMI-VOICED SOUND MARK か゛ 404B+309B HL KA + KHVSM ※combined or not?※ か゜ 404B+309C HL KA + KHSVSM ※ditto※ ゙ FF9E HW KATAKANA VOICED SOUND MARK ゚ FF9F HW KATAKANA SEMI-VOICED SOUND MARK ガ FF76+FF9E HWKL KA + HWKVSM ※combined?※ カ゚ FF76+FF9F HWKL KA + HWKSVSM ※how can do it?※ Windowsは基本的にprecomposed charactersのみ対応。 Macはデフォルトでは本体+合成用文字に分解する。 「H゙はPHSです。」 ─────────────────────────────────────── ☆たくさんあるハイフン類☆ - 002D HYPHEN-MINUS - FF0D FW HYPHEN-MINUS ‐ 2010 EN DASH — 2014 HORIZONTAL BAR ― 2015 EM DASH − 2212 MINUS SIGN = 003D EQUALS TO = FF1D FW EQUALS TO ゠ 30A0 KATAKANA-HIRAGANA DOUBLE HYPHEN ー 30FC HK PROLONGED SOUND MARK ー FF70 HALFWIDTH HK PROLONGED SOUND MARK ─ 2500 BOX DRAWINGS LIGHT HORIZONTAL SJIS EUC MS Mac 002D  2D 003D  3D 2010 815D 2014 - 2015 815C 2212 - 2500 849F 30FC 815B FF0D 817C FF1D 8181 FF70  B0 ─────────────────────────────────────── ☆アクセント記号類☆ ` 0060 GRAVE ACCENT ´ 00B4 ACUTE ACCENT ※X0208 unlike grave in ASCII※ p` 0060 p + GRAVE ACCENT p´ 00B4 p + ACUTE ACCENT ` FF40 FW GRAVE ACCENT p` FF40 p + FW GRAVE ACCENT ṕ p + COMBINING ACUTE ACCENT p̃ p + COMBINING TILDE ─────────────────────────────────────── ☆中点の問題☆ • 2022 BULLET · 00B7 MIDDLE DOT ・ 30FB KATAKANA MIDDLE DOT ● 25CF BLACK CIRCLE ・ FF65 HALFWIDTH KATAKANA MIDDLE DOT SJIS EUC MS Mac 00B7 - 2022 - 25CF 819C 30FB 8145 FF65  A5 ─────────────────────────────────────── ☆縦棒類☆ | 007C VERTICAL LINE ¦ 00A6 BROKEN BAR ‖ 2016 DOUBLE VERTICAL LINE ∥ 2225 PARALLEL TO | FF5C FW VERTICAL LINE ¦ FFE4 FW BROKEN BAR SJIS EUC MS Mac 007C  7C 00A6 - 2016 - 2225 8161 FF5C 8162 FFE4 FA55 ─────────────────────────────────────── ☆引用符類☆ " 0022 QUOTATION MARK ' 0027 APOSTROPHE ’ 2019 RIGHT SINGLE QUOTATION MARK ” 201D RIGHT DOUBLE QUOTATION MARK ′ 2032 PRIME ″ 2033 DOUBLE PRIME 〝 301D REVERSED DOUBLE PRIME QUOTATION MARK 〟 301F DOUBLE PRIME QUOTATION MARK ' FF07 FULLWIDTH APOSTROPHE " FF02 FULLWIDTH QUOTATION MARK SJIS EUC MS Mac 0022  22 0027  27 2019 8166 201D 8168 2032 818C 2033 818D 301D 8780 301F 8781 FF07 FA56 FF02 FA57 ─────────────────────────────────────── ☆ギリシャ文字☆ φ 03C6 GREEK SMALL LETTER PHI ε 03B5 GREEK SMALL LETTER EPSILON TeXだとε/π/θ/ρ/φには異体字があるんですが… ※\varsigmaは語末用シグマ(ς)です ───────────────────────────────────────