XMLってなぁに? 初級編 第1回
この文書は執筆時点(2004/後半)での知識を基にしており、現状とあっていない可能性があります。
XMLとはeXtensible Markup Languageといって、拡張可能なマーク言語といわれてる。
一番単純なXMLは以下のようなもの
<ROOT>内容</ROOT>
HTMLの親戚のようなものなので、マークも<>でくくられていて、<>から</>までの部分を修飾する。
それではUTF-8対応エディタ(とりあえずメモ帳が無難)で、上記をUTF-8保存してみよう。
a.xmlというファイル名で保存する。
IEで表示してみよう
<ROOT>内容</ROOT>
と表示されたと思う。
ちなみに、HTMLと違うところは、タグの文字には何を使ってもよい、大文字小文字は別文字と判断する、必ず閉じタグを用意しなくてはいけない。
といったところだ。
では次に
<ROOT></ROOT>
と内容を消して保存、表示をしてみよう。
<ROOT />
このように表示されたと思う。
これは<ROOT></ROOT>のように中身が無いタグの場合には<ROOT />と省略できるわけだ。
さてUTF-8ってなんなんだとかは別のサイトで見てもらうとして、ShiftJISという日本で古来から使われている文字コード体系がある。
で、これを使いたい場合にはそのままでは使えない。
XMLはデフォルトでUTF-8で書かれていると解釈するからだ。
<?xml version="1.0" encoding="shift_jis"?>
<ROOT>
内容
</ROOT>
と内容を変更して、Shift-JISで保存してみよう。
これでshift-jisでXMLファイルを扱うことが出来る。
ただしXMLの基本はあくまでUTF-8だし、Shift_JISは問題が多いので、ここではUTF-8で統一する。
UTF-8でさっきのXML宣言を追加したものが以下のものだ。
<?xml version="1.0" encoding="utf-8"?>
<ROOT>
内容
</ROOT>
ちなみにUTF-8で書く場合にはencodingの指定をしなくてもよいので
<?xml version="1.0"?>
<ROOT>
内容
</ROOT>
のようにも記述することが可能だ。