ページ「セカンダリネーム」と「文字列」の間の差分
imported>Fallout New Tokyo |
imported>Fallout New Tokyo |
||
1行目: | 1行目: | ||
− | ''' | + | '''文字列'''(読み:もじれつ、[[英語]]:string, text)とは、単語や文章のような複数の[[文字]]が連なったものである。 |
== 概要 == | == 概要 == | ||
− | + | 文字列は主に[[コンピューター]]の世界で使われる用語で文字の集合のことである。 | |
− | + | [[表計算ソフト]]においては、表示形式を単なる[[数値]]と区別する際に用いられる。 | |
− | + | [[文字]]で描かれた絵を[[外字]]([[ARIB外字]]や[[携帯電話]]の[[絵文字]]が有名)といい、文字列で描かれた絵を[[アスキーアート]]という。 | |
+ | |||
+ | == コンピューターにおける文字列 == | ||
+ | [[コンピューター]]において全ての情報は[[数値]]([[ビット]]の並び:[[ビット列]])として表現されるので、文字列中の個々の[[文字]]も最終的にはビット列として[[記憶]]され[[演算]]される。この[[文字]]と[[ビット列]]との対応付けが[[文字コード]]である。 | ||
+ | |||
+ | [[オペレーティングシステム]]や[[プログラミング言語]]などによって扱うことのできる[[文字コード]]に違いはあるが、同じ[[文字コード]]であれば、同じ[[ビット列]]から同じ[[文字]]を取り出すことができる。 | ||
+ | |||
+ | [[PC-9801シリーズ]]の強い影響を受けた[[Windows]]のように当初から多バイト文字([[日本語]]のみ)に対応した[[オペレーティングシステム]]や、[[プログラミング言語]]レベルでも[[C Sharp|C#]]や[[Java]]をはじめ最近では当初から多バイト文字に対応したものもある。 | ||
+ | |||
+ | 多バイト文字のコードには[[JISコード]]、[[EUC]]、[[Unicode]]などが乱立している。 | ||
+ | |||
+ | == プログラム言語における文字列 == | ||
+ | 文字列の処理は、[[数値演算]]と並んで[[コンピューター]]の基本的な処理であり、多くの[[プログラミング言語]]でそれを表現するための[[型]]や[[手続き]]、[[関数]]などの機能を持つ。コンピューターグラフィックスを扱うのが難しいようなプログラミング言語であっても数値と文字列は標準で扱えることが多い。 | ||
+ | |||
+ | [[FORTRAN]]に始まる伝統的な[[プログラミング言語]]では、1文字は1[[バイト]]の[[数値]]で表現され、文字列は一般にその[[配列]]として扱われる。文字列の終了を示すために最後に特定の文字を入れる方式の[[プログラミング言語]]と、別途文字列の長さを示す情報を持たせる[[プログラミング言語]]がある。前者には[[C言語]]やその派生言語があり、終了文字として[[Null文字]]を使う。後者の例としては[[Pascal]]などがある。 | ||
+ | |||
+ | == その他 == | ||
== 関連項目 == | == 関連項目 == | ||
− | * [[ | + | *[[数値]] |
− | * [[ | + | *[[文字]] |
+ | *[[特殊文字]] | ||
+ | *[[空文字列]] | ||
+ | *[[文字列探索]] | ||
+ | *[[正規表現]] | ||
+ | *[[アスキーアート]] | ||
== 参考文献 == | == 参考文献 == |
2014年2月27日 (木) 02:25時点における最新版
文字列(読み:もじれつ、英語:string, text)とは、単語や文章のような複数の文字が連なったものである。
概要[編集 | ソースを編集]
文字列は主にコンピューターの世界で使われる用語で文字の集合のことである。
表計算ソフトにおいては、表示形式を単なる数値と区別する際に用いられる。
文字で描かれた絵を外字(ARIB外字や携帯電話の絵文字が有名)といい、文字列で描かれた絵をアスキーアートという。
コンピューターにおける文字列[編集 | ソースを編集]
コンピューターにおいて全ての情報は数値(ビットの並び:ビット列)として表現されるので、文字列中の個々の文字も最終的にはビット列として記憶され演算される。この文字とビット列との対応付けが文字コードである。
オペレーティングシステムやプログラミング言語などによって扱うことのできる文字コードに違いはあるが、同じ文字コードであれば、同じビット列から同じ文字を取り出すことができる。
PC-9801シリーズの強い影響を受けたWindowsのように当初から多バイト文字(日本語のみ)に対応したオペレーティングシステムや、プログラミング言語レベルでもC#やJavaをはじめ最近では当初から多バイト文字に対応したものもある。
多バイト文字のコードにはJISコード、EUC、Unicodeなどが乱立している。
プログラム言語における文字列[編集 | ソースを編集]
文字列の処理は、数値演算と並んでコンピューターの基本的な処理であり、多くのプログラミング言語でそれを表現するための型や手続き、関数などの機能を持つ。コンピューターグラフィックスを扱うのが難しいようなプログラミング言語であっても数値と文字列は標準で扱えることが多い。
FORTRANに始まる伝統的なプログラミング言語では、1文字は1バイトの数値で表現され、文字列は一般にその配列として扱われる。文字列の終了を示すために最後に特定の文字を入れる方式のプログラミング言語と、別途文字列の長さを示す情報を持たせるプログラミング言語がある。前者にはC言語やその派生言語があり、終了文字としてNull文字を使う。後者の例としてはPascalなどがある。