文字列
文字列(読み:もじれつ、英語:string, text)とは、単語や文章のような複数の文字が連なったものである。
概要
文字列は主にコンピューターの世界で使われる用語で文字の集合のことである。
表計算ソフトにおいては、表示形式を単なる数値と区別する際に用いられる。
文字で描かれた絵を外字(ARIB外字や携帯電話の絵文字が有名)といい、文字列で描かれた絵をアスキーアートという。
コンピューターにおける文字列
コンピューターにおいて全ての情報は数値(ビットの並び:ビット列)として表現されるので、文字列中の個々の文字も最終的にはビット列として記憶され演算される。この文字とビット列との対応付けが文字コードである。
オペレーティングシステムやプログラミング言語などによって扱うことのできる文字コードに違いはあるが、同じ文字コードであれば、同じビット列から同じ文字を取り出すことができる。
PC-9801シリーズの強い影響を受けたWindowsのように当初から多バイト文字(日本語のみ)に対応したオペレーティングシステムや、プログラミング言語レベルでもC#やJavaをはじめ最近では当初から多バイト文字に対応したものもある。
多バイト文字のコードにはJISコード、EUC、Unicodeなどが乱立している。
プログラム言語における文字列
文字列の処理は、数値演算と並んでコンピューターの基本的な処理であり、多くのプログラミング言語でそれを表現するための型や手続き、関数などの機能を持つ。コンピューターグラフィックスを扱うのが難しいようなプログラミング言語であっても数値と文字列は標準で扱えることが多い。
FORTRANに始まる伝統的なプログラミング言語では、1文字は1バイトの数値で表現され、文字列は一般にその配列として扱われる。文字列の終了を示すために最後に特定の文字を入れる方式のプログラミング言語と、別途文字列の長さを示す情報を持たせるプログラミング言語がある。前者にはC言語やその派生言語があり、終了文字としてNull文字を使う。後者の例としてはPascalなどがある。