文字列
概要編集
コンピューターにおける文字列編集
コンピューターにおいて全ての情報は数値(ビットの並び:ビット列)として表現されるので、文字列中の個々の文字も最終的にはビット列として記憶され演算される。この文字とビット列との対応付けが文字コードである。
オペレーティングシステムやプログラミング言語などによって扱うことのできる文字コードに違いはあるが、同じ文字コードであれば、同じビット列から同じ文字を取り出すことができる。
PC-9801シリーズの強い影響を受けたWindowsのように当初から多バイト文字(日本語のみ)に対応したオペレーティングシステムや、プログラミング言語レベルでもC#やJavaをはじめ最近では当初から多バイト文字に対応したものもある。
プログラム言語における文字列編集
文字列の処理は、数値演算と並んでコンピューターの基本的な処理であり、多くのプログラミング言語でそれを表現するための型や手続き、関数などの機能を持つ。コンピューターグラフィックスを扱うのが難しいようなプログラミング言語であっても数値と文字列は標準で扱えることが多い。
FORTRANに始まる伝統的なプログラミング言語では、1文字は1バイトの数値で表現され、文字列は一般にその配列として扱われる。文字列の終了を示すために最後に特定の文字を入れる方式のプログラミング言語と、別途文字列の長さを示す情報を持たせるプログラミング言語がある。前者にはC言語やその派生言語があり、終了文字としてNull文字を使う。後者の例としてはPascalなどがある。