データとは

データ(data)とは、ある事柄を表すために用いられる、文字や数字、あるいは記号のことをいう。

データは本来、材料や資料などをまとめたものである。また、判断を引っ張り出すための材料を含んでいるという事実のことでもある。

コンピュータでいうデータは、文字、数字、記号といった個別のものから、文字列、数式、論理式、配列、そして算術や比較、論理演算子など、プログラム的に意味のある記号などを組み合わせて表現された集まりのことを指す。そのため、これらを使って生成されたファイルそのものをデータと呼ぶこともある。

コンピュータでは、プログラムとデータを分けて考えることもある。プログラムとは、コンピュータに出す命令の記述のことである。その命令文もデータには間違いないが、どちらかと言えば、計算の処理の仕方を示したものである。

例えば、あるホームページ作成ソフトを使ったとしよう。この場合、プログラム本体とは別の所に、画像や音楽、動画などのサンプルが格納されていたりする。この場合、ホームページ作成ソフトが必要に応じて、データである画像や音楽、動画といったファイルを引っ張り出す。

また、各ソフトは配列というデータを扱うことがよくある。配列とは一定のルールに従って並べたものだが、ソフトウェアでは、会員名に対してID番号、商品名に対して価格、ユーザ名に対してパスワード、といった形になる。これらは、ペアに分けたセグメントに一つのキーと一つの値が入る連想配列と呼ばれるものだが、更に複雑な多次元配列もある。こちらは、会員名に対してID番号、そしてこれに年齢、身長、体重など複数の条件でペアにしながら、複数のものを入れ、これを繰り返しながら奥深くに分類していくものである。簡単に言えば、配列の中に配列を入れ、更にこれらの内包を繰り返していくタイプである。

こういったものはプログラム本体とは別に、外部ファイルやデータベースなどで扱うことが多い。もちろん小さなデータであれば外部ファイル化やデータベース化はせず、同一ファイルのコード内に記述すれば済む話であるが。ただ、大きなデータになってくると、そうも言ってられなくなってくる。

複雑な仕組みになっているソースコード内に、仮に扱う商品が増えたからといって、その都度リビジョンのような形で商品名を追加登録するわけにもいかない。何らかの原因で、コードに改変が加えられたりでもしたら、フリーズするからである。デバッガを使うにしても、デバッグを行うにしても、こんなことで一々データを修正していたらキリがない。

という訳で、同じ情報でも、中核をなすソースコードと、商品名や価格といったあまり重要でない情報を分けてしまうことがよくある。そして、一般には後者のことを、商品データや会員データなどと言うことが多い。

データの意味を簡潔に説明すると

文字や数字、記号をひとまとまりにしたもの。