パース

パース(parse)とは、一定の法則に従った文書を構文解析することをいう。

パースは、XMLやHTML、プログラムなどの構文を解析することである。そのためのプログラムのことをパーサもしくは構文解析器という。パーサジェネレータと呼ばれるものは、これを作るプログラムのことをいう。

XMLやHTMLなどのマークアップ言語は、タグとテキストを用いたデータ構造をしている。これらを冠したパーサは、その構造を変換して、プログラムにとって扱いやすい形にする。これをパースという。

例えば、XMLやHTMLなどは一定パターンを持つタグなどが使われている。これらを抽出する際、そのままだと単なる連結文字になるため、これをソフトウェアなどで直接処理するには扱いにくい。そこで配列などの形式に変換してしまうとプログラムにとって扱いやすくなる。こういった処理をパースという。

また、パースはコンパイラの持つ一部の機能であるパーサが行う処理でもある。コンパイラとは、人間の作ったソースコード機械語に変換するソフトウェアのこと。字句解析に続いてパースされることが多い。パーサでは、基礎となる要素を特定し、そこからより大きな要素へとパースを進めるタイプと、大枠の要素を特定してから細かい部分へパースを進めるタイプがある。

プログラミング言語には厳密なルールが存在し、その言語で作られた文法や構文が正しいかとうかを解析することをパースという。エラーが発生するとパースエラーとなる。

パースの意味を簡潔に説明すると

構文解析をすること。