利用者:Fet-Fe
ナビゲーションに移動
検索に移動
Unicodeのノウハウ
異体字セレクタ
UnicodeのCJK Unified Ideographsに載っていない書体の漢字でも、U+E0100〜U+E01EFの異体字セレクタ(IVS; Ideographic Variation Sequence)[1]を用いて表現することができる。
例えば「唐」という漢字には、縦棒が下に突き出ている異体字が存在する。これを表現するには、「唐」の後ろにU+E0101を付ければ良い(唐󠄁)。見えない場合はおま環。
異体字セレクタセレクタで実験したり、GlyphWikiから検索したりすることで書体を見つけることができる。
アポストロフィ
キーボードから入力しやすいのは'(APOSTROPHE、U+0027)であるが、アポストロフィとしては他の文字が推奨されている[2]。
英語やフランス語のアポストロフィとして推奨されるのは’(RIGHT SINGLE QUOTATION MARK、U+2019)である[3]。これは‘’という引用符の右側のものと同じである。なので‘I’ll kill Takahiro Karasawa.’のように同じ文字で2つの役割となる。
一方でタヒチ語などでの声門閉鎖音の正書法やIPAの放出音、ウクライナ語での軟音化などを表す文字はʼ(MODIFIER LETTER APOSTROPHE、U+02BC)である[4]。
記号としてのアポストロフィがU+2019、文字としてのアポストロフィがU+02BCであると捉えることもできる。
他にウズベク語やハワイ語で用いられるʻ(MODIFIER LETTER REVERSED COMMA、U+02BD)も存在する。