Fet-Fe

2024年11月8日 (金)に参加
編集の要約なし
>Fet-Fe
編集の要約なし
>Fet-Fe
編集の要約なし
6行目: 6行目:


日本語では濁点や半濁点の結合文字が存在する。通常の濁点と半濁点はそれぞれ゛(U+309B)と゜(U+309C)であるが、結合文字は ゙(U+3099)と ゚(U+309A)である。
日本語では濁点や半濁点の結合文字が存在する。通常の濁点と半濁点はそれぞれ゛(U+309B)と゜(U+309C)であるが、結合文字は ゙(U+3099)と ゚(U+309A)である。
「が」などの濁音には専用の文字が存在するので、通常これらを用いることはない。
「が」などの濁音には専用の文字コードが存在するので、通常これらを用いることはない。
しかし結合文字を用いることでUnicodeに登録されていない文字を表現することができる。例えば「ン゙」「[[東光院|墓゚]]」など。結合文字でない「墓゜」よりも見栄えが良い。
しかし結合文字を用いることでUnicodeに登録されていない文字を表現することができる。例えば「ン゙」「[[東光院|墓゚]]」など。結合文字でない「墓゜」よりも見栄えが良い。


=== 漢字構成記述文字 ===
=== 漢字構成記述文字 ===
Unicodeに登録されていない漢字を、登録されている字の組み合わせで表現するための文字。「[[誹謗中傷対策マーク|⿰馬K]]」など。
Unicodeに登録されていない漢字を登録されている字の組み合わせで表現するための文字。「[[馬K|⿰馬K]]」など。
システム側で上手く合成するように要求するわけではないので見栄えは悪いが、⿱や⿵、再帰的な記述を用いて複雑な字形も表せる。
システム側で上手く合成するように要求するわけではないので見栄えは悪いが、⿱や⿵、再帰的な記述を用いて複雑な字形も表せる。


16行目: 16行目:
UnicodeのCJK Unified Ideographsに載っていない書体の漢字でも、U+E0100〜U+E01EFの異体字セレクタ(IVS; Ideographic Variation Sequence)<ref>https://www.unicode.org/charts/PDF/UE0100.pdf</ref>を用いて表現することができる。
UnicodeのCJK Unified Ideographsに載っていない書体の漢字でも、U+E0100〜U+E01EFの異体字セレクタ(IVS; Ideographic Variation Sequence)<ref>https://www.unicode.org/charts/PDF/UE0100.pdf</ref>を用いて表現することができる。


例えば「唐」という漢字には、縦棒が下に突き出ている異体字が存在する。これを表現するには、「唐」の後ろにU+E0101を付ければ良い(唐󠄁)。見えない場合はおま環。
例えば「唐」という漢字には縦棒が下に突き出ている異体字が存在する。これを表現するには「唐」の後ろにU+E0101を付ければ良い(唐󠄁)。見えない場合はおま環。


[https://747.github.io/vsselector/ 異体字セレクタセレクタ]で実験したり、[https://glyphwiki.org/wiki/u5510-ue0101 GlyphWiki]から検索したりすることで書体を見つけることができる。
[https://747.github.io/vsselector/ 異体字セレクタセレクタ]で実験したり、[https://glyphwiki.org/wiki/u5510-ue0101 GlyphWiki]から検索したりすることで書体を見つけることができる。
53行目: 53行目:


例えば中国語で“唐泽贵洋。”と表示すると、Wikiのhtmlのlang設定が全体として"ja"(日本語)になっているため、簡体字だけ変なフォントで表示されることがよくある。
例えば中国語で“唐泽贵洋。”と表示すると、Wikiのhtmlのlang設定が全体として"ja"(日本語)になっているため、簡体字だけ変なフォントで表示されることがよくある。
そのような時にlang="zh"を設定すれば、<span lang="zh">“唐泽贵洋。”</span>と表示される。
そのような時にlang="zh"を設定すれば<span lang="zh">“唐泽贵洋。”</span>と表示される。


ウルドゥー語のlang="ur"を指定すれば、環境によっては自動でナスタアリーク体のフォントを使用してくれる。
ウルドゥー語のlang="ur"を指定すれば、環境によっては自動でナスタアリーク体のフォントを使用してくれる。
62行目: 62行目:
特にGoogleホーモのChromeとかいうゴリブラは極一部の言語しかlangタグが効いているように見えないので、ちゃんと見た目を整えたいならフォント指定は必須。
特にGoogleホーモのChromeとかいうゴリブラは極一部の言語しかlangタグが効いているように見えないので、ちゃんと見た目を整えたいならフォント指定は必須。
というかFirefoxを使う、それはできるよね。
というかFirefoxを使う、それはできるよね。


言語コードについてはISO 639-1かISO 639-3あたりを用いるのが良い。
言語コードについてはISO 639-1かISO 639-3あたりを用いるのが良い。
68行目: 67行目:


地域の指定もできる。ISO 3166などを用いる。
地域の指定もできる。ISO 3166などを用いる。
例えば台湾の中国語を指定したい場合、ISO 3166-1で示されているTWを用いて、lang="zh-TW"とする。
例えば台湾の中国語を指定したい場合、ISO 3166-1で示されているTWを用いてlang="zh-TW"とする。


: <span lang="zh-TW">“唐澤貴洋。”</span>
: <span lang="zh-TW">“唐澤貴洋。”</span>
74行目: 73行目:


更には文字種の指定も可能。
更には文字種の指定も可能。
ペルシャ語の<span lang="fa" dir="rtl">«تاکاهیرو کاراساوا قرآن را سوخت و به محمد توهین کرد.»</span>をナスタアリーク体で表記したい場合、ISO 15924で定義されたナスタアリーク体の符号Aranを用いて、lang="fa-Aran"とする。
ペルシャ語の<span lang="fa" dir="rtl">«تاکاهیرو کاراساوا قرآن را سوخت و به محمد توهین کرد.»</span>をナスタアリーク体で表記したい場合、ISO 15924で定義されたナスタアリーク体の符号Aranを用いてlang="fa-Aran"とする。


: <span lang="fa-Aran" dir="rtl">تاکاهیرو کاراساوا قرآن را سوخت و به محمد توهین کرد.</span>
: <span lang="fa-Aran" dir="rtl">تاکاهیرو کاراساوا قرآن را سوخت و به محمد توهین کرد.</span>
94行目: 93行目:
: <span lang="ar">حرق تاكاهيرو كاراساوا القرآن وأهان محمدًا.</span>
: <span lang="ar">حرق تاكاهيرو كاراساوا القرآن وأهان محمدًا.</span>


dir="rtl"を設定すれば、正しい表示がなされる。
dir="rtl"を設定すれば正しい表示がなされる。


: <span lang="ar" dir=rtl>حرق تاكاهيرو كاراساوا القرآن وأهان محمدًا.</span>
: <span lang="ar" dir=rtl>حرق تاكاهيرو كاراساوا القرآن وأهان محمدًا.</span>
=== ルビ ===
HTMLのrubyタグで振り仮名を振ることができる<ref>https://developer.mozilla.org/ja/docs/Web/HTML/Element/ruby</ref>。
&lt;ruby&gt;唐澤貴洋&lt;rt&gt;からさわたかひろ&lt;/rt&gt;&lt;/ruby&gt;と記述することで下のような出力がなされる。
<ruby>唐澤貴洋<rt>からさわたかひろ</rt></ruby>
更にrpタグを用いることで、rubyタグへの対応が無いブラウザでの表示をコントロールできる(でも今時そんなことをする必要はなさそう)。
例えば&lt;ruby lang="ko"&gt;唐澤貴洋&lt;rp&gt;(&lt;/rp&gt;&lt;rt&gt;당택귀양&lt;/rt&gt;&lt;rp&gt;)&lt;/rp&gt;&lt;/ruby&gt;の結果は下のようになる。
<ruby lang="ko">唐澤貴洋<rp>(</rp><rt>당택귀양</rt><rp>)</rp></ruby>
但しrubyタグに対応していなければ下のようになる。
<span lang="ko">唐澤貴洋(당택귀양)</span>
=== 縦書き ===
日本語の縦書きはCSSでwriting-mode: vertical-rl;<ref>https://developer.mozilla.org/ja/docs/Web/CSS/writing-mode</ref>を指定すれば良い。
英数字を縦にするにはtext-orientation: upright;<ref>https://developer.mozilla.org/ja/docs/Web/CSS/text-orientation</ref>を指定する。
<span style="writing-mode: vertical-rl;">2021年に唐澤貴洋knifeで<br>メッタ刺しにして殺す。</span>
<span style="writing-mode: vertical-rl; text-orientation: upright;">2021年に唐澤貴洋knifeで<br>メッタ刺しにして殺す。</span>
モンゴル語の場合はwriting-mode: vertical-lr;を指定する。
Safariだと文字の向きが正しくなくなるので、text-orientation: sideways;も指定する。
<span lang="mn" style="writing-mode: vertical-lr; text-orientation: sideways;">ᠮᠤᠩᠭᠤᠯ<br>ᠬᠡᠯᠡ</span>
回鶻語やソグド語の縦書きにはwriting-mode: sideways-lr;を用いる。
但しFirefox以外のブラウザには対応していないので、writing-mode: vertical-rl;をtransform: rotateZ(180deg);で180度回転させる方が汎用性が高い。
<span lang="sog" dir="rtl "style="writing-mode: vertical-rl; text-orientation: sideways; transform: rotateZ(180deg);">𐽂𐼰𐼸𐼰𐼳𐼷𐽀𐼷 𐼸𐼰𐽀𐼰𐼼𐼰𐼴𐼷<br>𐼾𐽂𐼶𐼴𐼰𐼷𐼺𐼸𐼰𐼻𐽘</span>


== 脚註 ==
== 脚註 ==
<references />
<references />
匿名利用者