语言
没有数据
通知
无通知
結合用の円・四角など 結合文字は先行する基底文字(非結合文字)と組み合わせて結合文字列(combining character sequence, CCS)を作る。結合文字は複数指定可能であり、通常はたとえば上につく結合文字が複数ある場合は上へ上へと積み重ねられるが、結合文字の種類によっては異なる表示がなされることもある。
コンピュータにおいて全ての情報は数値(ビットの並び:ビット列)として表現されるので、文字列中の個々の文字も最終的にはビット列として記憶され演算される。この文字とビット列との対応付けが文字コードである。プログラミング言語やオペレーティングシステムなどによって扱うことのできる文字コードに違いはあるが、同じ文字コードであれば、同じビット列から同じ文字を取り出すことができる。
形式言語理論における空文字列(くうもじれつ・からもじれつ、empty string)またはヌル文字列(null string)とは、長さが0の一意な文字列であり、文字列における空集合である。主にコンピュータ、特にプログラミング言語において用いられる用語である。
⇒ 縄文字
文字集合(もじしゅうごう、英: character set)は、文字、特にコンピュータにおけるキャラクタをその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c, ..., z, A, B, C, ..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ
を実行時に評価し、そのプレースホルダーを対応する値に置き換える処理である。変数補間 (へんすうほかん、variable interpolation)、変数置換(へんすうちかん、variable substitution)、変数展開(へんすうてんかい、variable
するパターンに応じて、アルゴリズムを切り替えるものもある)。正規表現による探索については正規表現の記事を参照のこと。 近年は、暗号化された文字列を復号せずに探索する秘匿検索、圧縮テキスト中の文字列探索の研究、多国語文字列のバイト列表現に対する探索の研究、なども行われている。
コンピューティングにおいて、テキスト終結文字(テキストしゅうけつもじ、ETX: End-of-Text character)とは、制御文字の一種で、受信側のコンピュータにデータの終端を知らせる目的で使われる。 ASCIIでは十進数で3、十六進数で0x03に割り当てられている。キャレット記法では ^C