「利用者:Fet-Fe」の版間の差分
ナビゲーションに移動
検索に移動
>KRSW40K (もう一度すみません、「利用者・トーク」にうpすべきなのを、ここに上げてしまいました。当該の文は削除して、「利用者・トーク」にうpし直しました。) |
>Fet-Fe 編集の要約なし |
||
1行目: | 1行目: | ||
== Unicodeのノウハウ == | |||
=== 異体字セレクタ === | |||
UnicodeのCJK Unified Ideographsに載っていない書体の漢字でも、U+E0100〜U+E01EFの異体字セレクタ<ref>https://www.unicode.org/charts/PDF/UE0100.pdf</ref>を用いて表現することができる。 | |||
例えば「唐」という漢字には、縦棒が下に突き出ている異体字が存在する。これを表現するには、「唐」の後ろにU+E0101を付ければ良い(唐󠄁)。見えない場合はおま環。 | |||
[https://747.github.io/vsselector/ 異体字セレクタセレクタ]で実験したり、[https://glyphwiki.org/wiki/u5510-ue0101 GlyphWiki]から検索したりすることで書体を見つけることができる。 | |||
=== アポストロフィ === | |||
キーボードから入力しやすいのは'(APOSTROPHE、U+0027)であるが、アポストロフィとしては他の文字が推奨されている<ref>http://www.unicode.org/charts/PDF/U0000.pdf</ref>。 | |||
英語やフランス語のアポストロフィとして推奨されるのは’(RIGHT SINGLE QUOTATION MARK、U+2019)である<ref>https://www.unicode.org/charts/PDF/U2000.pdf</ref>。これは‘’という引用符の右側のものと同じである。なので‘I’ll kill Takahiro Karasawa.’のように同じ文字で2つの役割となる。 | |||
一方でタヒチ語などでの声門閉鎖音の正書法やIPAの放出音、ウクライナ語での軟音化などを表す文字はʼ(MODIFIER LETTER APOSTROPHE、U+02BC)である<ref>https://www.unicode.org/charts/PDF/U02B0.pdf</ref>。 | |||
記号としてのアポストロフィがU+2019、文字としてのアポストロフィがU+02BCであると捉えることもできる。 | |||
他にウズベク語やハワイ語で用いられるʻ(MODIFIER LETTER REVERSED COMMA、U+02BD)も存在する。 | |||
== 脚註 == | |||
<references /> |
2021年8月22日 (日) 19:07時点における版
Unicodeのノウハウ
異体字セレクタ
UnicodeのCJK Unified Ideographsに載っていない書体の漢字でも、U+E0100〜U+E01EFの異体字セレクタ[1]を用いて表現することができる。
例えば「唐」という漢字には、縦棒が下に突き出ている異体字が存在する。これを表現するには、「唐」の後ろにU+E0101を付ければ良い(唐󠄁)。見えない場合はおま環。
異体字セレクタセレクタで実験したり、GlyphWikiから検索したりすることで書体を見つけることができる。
アポストロフィ
キーボードから入力しやすいのは'(APOSTROPHE、U+0027)であるが、アポストロフィとしては他の文字が推奨されている[2]。
英語やフランス語のアポストロフィとして推奨されるのは’(RIGHT SINGLE QUOTATION MARK、U+2019)である[3]。これは‘’という引用符の右側のものと同じである。なので‘I’ll kill Takahiro Karasawa.’のように同じ文字で2つの役割となる。
一方でタヒチ語などでの声門閉鎖音の正書法やIPAの放出音、ウクライナ語での軟音化などを表す文字はʼ(MODIFIER LETTER APOSTROPHE、U+02BC)である[4]。
記号としてのアポストロフィがU+2019、文字としてのアポストロフィがU+02BCであると捉えることもできる。
他にウズベク語やハワイ語で用いられるʻ(MODIFIER LETTER REVERSED COMMA、U+02BD)も存在する。