语言
没有数据
通知
无通知
Unicode > Unicodeの互換文字 Unicodeの互換文字(ごかんもじ、英語: Compatibility Character)とは、ユニコードコンソーシアムが使わないことを推奨している、図形文字の一群である。UnicodeとUCSについて議論するときに言及されることが多い。
U+06C4 ۄ ARABIC LETTER WAW WITH RING カシミール語母音[ɔ]を表す。 U+06C5 ۅ ARABIC LETTER KIRGHIZ OE キルギス語母音[ø]を表す。 ワーウの尾部がループ状になっているものと、尾部を突き抜けるように横線が書かれているものの2種類のグリフのバリエーションが存在する。
しかし、個々の用字もそれ自身の句読文字や発音区別符号を持っているので、多くの用字は文字だけでなく発音区別符号やその他の記号、句読点、数字、その用字に固有の記号やスペース文字を含んでいる。 Unicode 13.0では、現代の用字91種と古代の・歴史的な用字63種の合計154種の用字が定義されている。その他にも、文字
〖mapping〗
Latin)は、Unicodeの1つ目のブロックである。ASCII文字コードの全ての文字(基本ラテン文字と制御文字)が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字(C0 Controls and Basic Latin)ともいう。UTF-8において、収録されたキャラクタが1バイトで表現できる唯一のブロックである。
符号化文字に対応されることもある。 文字符号化形式 (CEF) 符号化文字集合の非負整数を符号単位列に変換する方法。文字符号化形式はコンピュータ中に実際にデータとして文字を表現することを可能にする。 文字符号化方式 (CES) 符号単位列をバイト列に直列化する方法。符号
漢字構成記述文字(かんじこうせいきじゅつもじ、英語: Ideographic Description Characters)は、Unicodeのブロックの一つであり、12個の「漢字構成記述文字」が収録されている。 漢字構成記述文字とは、Unicodeに含まれていない漢字などを、他の漢字を組み合わせに
前進を伴う修飾文字、02B0–02FF 音声記号拡張、1D00–1D7F 音声記号拡張補助、1D80–1DBF ラテン文字拡張追加、1E00–1EFF 上付き・下付き、2070–209F 文字様記号、2100–214F 数字に準ずるもの、2150–218F ラテン文字拡張C、2C60–2C7F ラテン文字拡張D、A720–A7FF