中の技術日誌
 

XMLってなぁに? 初級編 第1回

2005/01/14

この文書は執筆時点(2004/後半)での知識を基にしており、現状とあっていない可能性があります。

XMLとはeXtensible Markup Languageといって、拡張可能なマーク言語といわれてる。
一番単純なXMLは以下のようなもの

<ROOT>内容</ROOT>

HTMLの親戚のようなものなので、マークも<>でくくられていて、<>から</>までの部分を修飾する。

それではUTF-8対応エディタ(とりあえずメモ帳が無難)で、上記をUTF-8保存してみよう。
a.xmlというファイル名で保存する。

IEで表示してみよう

<ROOT>内容</ROOT>

と表示されたと思う。

ちなみに、HTMLと違うところは、タグの文字には何を使ってもよい、大文字小文字は別文字と判断する、必ず閉じタグを用意しなくてはいけない。
といったところだ。

では次に

<ROOT></ROOT>

と内容を消して保存、表示をしてみよう。

<ROOT />

このように表示されたと思う。
これは<ROOT></ROOT>のように中身が無いタグの場合には<ROOT />と省略できるわけだ。


さてUTF-8ってなんなんだとかは別のサイトで見てもらうとして、ShiftJISという日本で古来から使われている文字コード体系がある。
で、これを使いたい場合にはそのままでは使えない。

XMLはデフォルトでUTF-8で書かれていると解釈するからだ。

<?xml version="1.0" encoding="shift_jis"?>
<ROOT>
内容
</ROOT>

と内容を変更して、Shift-JISで保存してみよう。
これでshift-jisでXMLファイルを扱うことが出来る。
ただしXMLの基本はあくまでUTF-8だし、Shift_JISは問題が多いので、ここではUTF-8で統一する。

UTF-8でさっきのXML宣言を追加したものが以下のものだ。

<?xml version="1.0" encoding="utf-8"?>
<ROOT>
内容
</ROOT>

ちなみにUTF-8で書く場合にはencodingの指定をしなくてもよいので

<?xml version="1.0"?>
<ROOT>
内容
</ROOT>

のようにも記述することが可能だ。



勉強会: 05/18 大阪 登録受付中

中の技術日誌
コンテンツ
わんくま同盟
わんくま同盟
わんくま同盟
広告
バナー
MVP LOGO
MSMVP Visual C# Since 2004/04-2007/03
MCP LOGO
070-316
姉妹サイト
姉妹サイト:じゃんぬのC#, VB.NET 入門
じゃんぬの
C#, VB.NET 入門
検索
Google

ブログ本家
広告