XML

Java – XMLを読み込んでパースするまでをわかりやすく解説

2025-04-15更新日: 2025-04-15

JavaでXMLを読み込んでパースするには、主に「DOMパーサー」や「SAXパーサー」、または StAX などのAPIを使用します。

一般的な方法として、javax.xml.parsersパッケージのDocumentBuilderを用いるDOMパーサーが挙げられます。

XMLファイルをInputStreamやファイルパスで読み込み、DocumentBuilderでDocumentオブジェクトに変換します。

その後、getElementsByTagNameやgetAttributeを使ってノードや属性を操作します。

DOMはメモリ上に全体を展開するため、小規模なXMLに適しています。

目次から探す

XMLパースとは何か
JavaでXMLをパースする方法の選択肢
DOMパーサーを使ったXMLパースの手順
SAXパーサーを使ったXMLパースの手順
StAXパーサーを使ったXMLパースの手順
XMLパース時の注意点
実践例：簡単なXMLパースのサンプルコード
- サンプルXMLファイル
どのパーサーを選ぶべきか
まとめ

XMLパースとは何か

XML(eXtensible Markup Language)は、データを構造化して表現するためのマークアップ言語です。

主にデータの保存や転送に利用され、さまざまなアプリケーションで広く使われています。

XMLをパースするとは、XML形式のデータをプログラムが理解できる形に変換することを指します。

これにより、データの読み取りや操作が可能になります。

XMLパースの主な目的は以下の通りです：

データの抽出: XMLから特定の情報を取り出すことができる。
データの変換: XMLデータを他の形式(JSONなど)に変換することができる。
データの検証: XMLが正しい形式であるかを確認することができる。

XMLパースは、特にWebサービスやデータベースとの連携において重要な役割を果たします。

Javaでは、XMLをパースするためのさまざまなライブラリやAPIが用意されており、用途に応じて使い分けることができます。

JavaでXMLをパースする方法の選択肢

Javaでは、XMLをパースするためのいくつかの方法が用意されています。

それぞれの方法には特徴があり、用途に応じて使い分けることが重要です。

以下に、主なXMLパースの方法をまとめます。

パーサーの種類	特徴	使用例
DOMパーサー	XML全体をメモリに読み込み、ツリー構造で表現する。	小規模なXMLファイルの操作に適している。
SAXパーサー	イベント駆動型で、XMLを逐次的に読み込む。メモリ効率が良い。	大規模なXMLファイルの処理に適している。
StAXパーサー	ストリームベースで、プログラマが読み取りと書き込みを制御できる。	双方向のXML処理が必要な場合に適している。

これらのパーサーは、それぞれ異なるシナリオでの使用に適しています。

たとえば、DOMパーサーは小さなXMLファイルを扱う際に便利ですが、大きなファイルではメモリを大量に消費する可能性があります。

一方、SAXパーサーはメモリ効率が良く、大きなファイルを扱うのに適していますが、ツリー構造を持たないため、ランダムアクセスができません。

StAXパーサーは、ストリーム処理を行うため、柔軟性が高いのが特徴です。

これらの選択肢を理解することで、プロジェクトの要件に最適なXMLパースの方法を選ぶことができます。

DOMパーサーを使ったXMLパースの手順

DOM(Document Object Model)パーサーは、XML文書をメモリに読み込み、ツリー構造として表現します。

この方法では、XMLの各要素にアクセスしやすく、データの操作が簡単になります。

以下に、DOMパーサーを使ったXMLパースの手順を示します。

必要なライブラリのインポート

まず、DOMパーサーを使用するために必要なライブラリをインポートします。

Javaの標準ライブラリに含まれているため、特別なインストールは不要です。

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import java.io.File;

XMLファイルの読み込み

次に、XMLファイルを読み込みます。

DocumentBuilderFactoryを使用してDocumentBuilderを作成し、XMLファイルをDocumentオブジェクトに変換します。

XMLデータの解析

Documentオブジェクトを使用して、XMLの要素にアクセスします。

getElementsByTagNameメソッドを使って特定のタグを持つ要素を取得し、必要なデータを抽出します。

以下は、DOMパーサーを使用してXMLをパースするサンプルコードです。

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import java.io.File;
public class App {
    public static void main(String[] args) {
        try {
            // XMLファイルを指定
            File xmlFile = new File("sample.xml");
            
            // DocumentBuilderFactoryを作成
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            
            // DocumentBuilderを作成
            DocumentBuilder builder = factory.newDocumentBuilder();
            
            // XMLファイルをDocumentオブジェクトに変換
            Document document = builder.parse(xmlFile);
            
            // ルート要素を取得
            document.getDocumentElement().normalize();
            
            // 特定のタグを持つ要素を取得
            NodeList nodeList = document.getElementsByTagName("item");
            
            // 各要素をループしてデータを表示
            for (int i = 0; i < nodeList.getLength(); i++) {
                Element element = (Element) nodeList.item(i);
                String name = element.getElementsByTagName("name").item(0).getTextContent();
                String value = element.getElementsByTagName("value").item(0).getTextContent();
                
                // データを表示
                System.out.println("Name: " + name + ", Value: " + value);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

サンプルXMLファイル

上記のコードを実行するためには、以下のようなsample.xmlファイルが必要です。

<items>
    <item>
        <name>Item1</name>
        <value>Value1</value>
    </item>
    <item>
        <name>Item2</name>
        <value>Value2</value>
    </item>
</items>

上記のコードを実行すると、以下のような出力が得られます。

Name: Item1, Value: Value1
Name: Item2, Value: Value2

このように、DOMパーサーを使用することで、XMLデータを簡単に読み込み、操作することができます。

SAXパーサーを使ったXMLパースの手順

SAX(Simple API for XML)パーサーは、イベント駆動型のXMLパーサーであり、XML文書を逐次的に読み込むことが特徴です。

メモリ効率が良く、大規模なXMLファイルの処理に適しています。

以下に、SAXパーサーを使ったXMLパースの手順を示します。

必要なライブラリのインポート

SAXパーサーを使用するために必要なライブラリをインポートします。

Javaの標準ライブラリに含まれているため、特別なインストールは不要です。

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;

SAXハンドラーの作成

XMLの要素を処理するためのハンドラークラスを作成します。

このクラスはDefaultHandlerを拡張し、必要なメソッドをオーバーライドします。

XMLファイルの読み込み

SAXParserFactoryを使用してSAXParserを作成し、XMLファイルをパースします。

ハンドラーを指定して、XMLの要素を処理します。

以下は、SAXパーサーを使用してXMLをパースするサンプルコードです。

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.File;
public class App {
    public static void main(String[] args) {
        try {
            // XMLファイルを指定
            File xmlFile = new File("sample.xml");
            
            // SAXParserFactoryを作成
            SAXParserFactory factory = SAXParserFactory.newInstance();
            
            // SAXParserを作成
            SAXParser saxParser = factory.newSAXParser();
            
            // ハンドラーを作成
            DefaultHandler handler = new DefaultHandler() {
                boolean isName = false;
                boolean isValue = false;
                
                @Override
                public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
                    if (qName.equalsIgnoreCase("name")) {
                        isName = true;
                    } else if (qName.equalsIgnoreCase("value")) {
                        isValue = true;
                    }
                }
                
                @Override
                public void characters(char[] ch, int start, int length) throws SAXException {
                    if (isName) {
                        System.out.println("Name: " + new String(ch, start, length));
                        isName = false;
                    } else if (isValue) {
                        System.out.println("Value: " + new String(ch, start, length));
                        isValue = false;
                    }
                }
                
                @Override
                public void endElement(String uri, String localName, String qName) throws SAXException {
                    // 要素の終了処理が必要な場合はここに記述
                }
            };
            
            // XMLファイルをパース
            saxParser.parse(xmlFile, handler);
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

サンプルXMLファイル

上記のコードを実行するためには、以下のようなsample.xmlファイルが必要です。

<items>
    <item>
        <name>Item1</name>
        <value>Value1</value>
    </item>
    <item>
        <name>Item2</name>
        <value>Value2</value>
    </item>
</items>

上記のコードを実行すると、以下のような出力が得られます。

Name: Item1
Value: Value1
Name: Item2
Value: Value2

このように、SAXパーサーを使用することで、XMLデータを効率的に読み込み、処理することができます。

特に大規模なXMLファイルを扱う際に、そのメモリ効率の良さが活かされます。

StAXパーサーを使ったXMLパースの手順

StAX(Streaming API for XML)パーサーは、ストリームベースのXMLパーサーであり、プログラマがXMLの読み取りと書き込みを制御できるのが特徴です。

双方向のXML処理が可能で、メモリ効率も良いため、大規模なXMLファイルの処理に適しています。

以下に、StAXパーサーを使ったXMLパースの手順を示します。

必要なライブラリのインポート

StAXパーサーを使用するために必要なライブラリをインポートします。

Javaの標準ライブラリに含まれているため、特別なインストールは不要です。

import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLEventWriter;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLOutputFactory;
import javax.xml.stream.events.XMLEvent;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.io.OutputStream;

XMLファイルの読み込み

XMLInputFactoryを使用してXMLEventReaderを作成し、XMLファイルを読み込みます。

これにより、XMLの各要素を逐次的に処理できます。

XMLデータの解析

XMLEventReaderを使用して、XMLの要素を読み取り、必要なデータを抽出します。

各イベントを確認し、特定のタグに対して処理を行います。

以下は、StAXパーサーを使用してXMLをパースするサンプルコードです。

import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.events.XMLEvent;
import java.io.FileInputStream;
import java.io.InputStream;
public class App {
    public static void main(String[] args) {
        try {
            // XMLファイルを指定
            InputStream inputStream = new FileInputStream("sample.xml");
            
            // XMLInputFactoryを作成
            XMLInputFactory factory = XMLInputFactory.newInstance();
            
            // XMLEventReaderを作成
            XMLEventReader eventReader = factory.createXMLEventReader(inputStream);
            
            // イベントを逐次的に処理
            while (eventReader.hasNext()) {
                XMLEvent event = eventReader.nextEvent();
                
                // 開始タグの処理
                if (event.isStartElement()) {
                    String localPart = event.asStartElement().getName().getLocalPart();
                    
                    // nameタグの処理
                    if (localPart.equals("name")) {
                        event = eventReader.nextEvent(); // 次のイベントを取得
                        System.out.println("Name: " + event.asCharacters().getData());
                    }
                    
                    // valueタグの処理
                    if (localPart.equals("value")) {
                        event = eventReader.nextEvent(); // 次のイベントを取得
                        System.out.println("Value: " + event.asCharacters().getData());
                    }
                }
            }
            
            // ストリームを閉じる
            inputStream.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

サンプルXMLファイル

上記のコードを実行するためには、以下のようなsample.xmlファイルが必要です。

<items>
    <item>
        <name>Item1</name>
        <value>Value1</value>
    </item>
    <item>
        <name>Item2</name>
        <value>Value2</value>
    </item>
</items>

上記のコードを実行すると、以下のような出力が得られます。

Name: Item1
Value: Value1
Name: Item2
Value: Value2

このように、StAXパーサーを使用することで、XMLデータを効率的に読み込み、柔軟に処理することができます。

特に、ストリーム処理を行うため、メモリの使用量を抑えつつ、大規模なXMLファイルを扱うことが可能です。

XMLパース時の注意点

XMLをパースする際には、いくつかの注意点があります。

これらを理解しておくことで、エラーを防ぎ、効率的にデータを処理することができます。

以下に、XMLパース時の主な注意点をまとめます。

XMLの構文エラー

XMLは厳密な構文を持つため、タグの不一致や属性の誤りがあるとパースエラーが発生します。
XMLファイルを事前に検証し、正しい構文であることを確認することが重要です。

文字エンコーディング

XMLファイルの文字エンコーディングが正しく設定されていないと、文字化けが発生する可能性があります。
XML宣言(例：<?xml version="1.0" encoding="UTF-8"?>)を確認し、適切なエンコーディングを使用することが必要です。

大規模なXMLファイルの処理

大きなXMLファイルをDOMパーサーで処理すると、メモリを大量に消費する可能性があります。
SAXやStAXパーサーを使用することで、メモリ効率を改善し、大規模なファイルを扱うことができます。

名前空間の扱い

XMLには名前空間が存在する場合があり、これを正しく処理しないと要素が見つからないことがあります。
名前空間を考慮したパースを行うために、適切なAPIを使用することが重要です。

エラーハンドリング

XMLパース中にエラーが発生した場合、適切なエラーハンドリングを行うことが重要です。
例外処理を実装し、エラーの原因を特定できるようにすることで、デバッグが容易になります。

XMLのバージョン管理

XMLの仕様や構造が変更されることがあるため、バージョン管理を行うことが重要です。
異なるバージョンのXMLを扱う場合、パースロジックを適切に調整する必要があります。

これらの注意点を考慮することで、XMLパースのプロセスをスムーズに進めることができ、エラーを最小限に抑えることができます。

XMLデータを扱う際には、これらのポイントを常に意識しておくことが重要です。

実践例：簡単なXMLパースのサンプルコード

ここでは、Javaを使用してXMLをパースする簡単な実践例を示します。

この例では、DOMパーサーを使用してXMLファイルからデータを読み取り、特定の要素を表示します。

サンプルXMLファイル

まず、以下のようなsample.xmlファイルを用意します。

このファイルには、いくつかのアイテムが含まれています。

<items>
    <item>
        <name>Item1</name>
        <value>Value1</value>
    </item>
    <item>
        <name>Item2</name>
        <value>Value2</value>
    </item>
</items>

次に、上記のXMLファイルをパースするためのJavaコードを示します。

このコードは、DOMパーサーを使用してXMLを読み込み、各アイテムの名前と値を表示します。

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NodeList;
import java.io.File;
public class App {
    public static void main(String[] args) {
        try {
            // XMLファイルを指定
            File xmlFile = new File("sample.xml");
            
            // DocumentBuilderFactoryを作成
            DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
            
            // DocumentBuilderを作成
            DocumentBuilder builder = factory.newDocumentBuilder();
            
            // XMLファイルをDocumentオブジェクトに変換
            Document document = builder.parse(xmlFile);
            
            // ルート要素を取得
            document.getDocumentElement().normalize();
            
            // 特定のタグを持つ要素を取得
            NodeList nodeList = document.getElementsByTagName("item");
            
            // 各要素をループしてデータを表示
            for (int i = 0; i < nodeList.getLength(); i++) {
                Element element = (Element) nodeList.item(i);
                String name = element.getElementsByTagName("name").item(0).getTextContent();
                String value = element.getElementsByTagName("value").item(0).getTextContent();
                
                // データを表示
                System.out.println("Name: " + name + ", Value: " + value);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

XMLファイルの読み込み: Fileオブジェクトを使用してXMLファイルを指定し、DocumentBuilderを使ってDocumentオブジェクトに変換します。
要素の取得: getElementsByTagNameメソッドを使用して、itemタグを持つ要素を取得します。
データの表示: 各item要素からnameとvalueを取得し、コンソールに表示します。

上記のコードを実行すると、以下のような出力が得られます。

Name: Item1, Value: Value1
Name: Item2, Value: Value2

この実践例を通じて、XMLパースの基本的な流れを理解することができます。

DOMパーサーを使用することで、XMLデータを簡単に読み込み、操作することが可能です。

どのパーサーを選ぶべきか

XMLをパースする際には、プロジェクトの要件やデータの特性に応じて適切なパーサーを選ぶことが重要です。

以下に、DOM、SAX、StAXの各パーサーの特徴を比較し、どのような状況でそれぞれを選ぶべきかを解説します。

DOMパーサー

特徴: XML全体をメモリに読み込み、ツリー構造で表現します。

ランダムアクセスが可能で、データの操作が簡単です。

適した用途:
- 小規模なXMLファイルを扱う場合
- データの読み取りと書き込みを頻繁に行う場合
- XMLの構造を変更する必要がある場合

SAXパーサー

特徴: イベント駆動型で、XMLを逐次的に読み込みます。

メモリ効率が良く、大規模なXMLファイルの処理に適しています。

適した用途:
- 大規模なXMLファイルを扱う場合
- メモリ使用量を抑えたい場合
- XMLの内容を一方向に処理するだけでよい場合(例: データの抽出)

StAXパーサー

特徴: ストリームベースで、プログラマが読み取りと書き込みを制御できます。

双方向のXML処理が可能です。

適した用途:
- 大規模なXMLファイルを効率的に処理したい場合
- XMLの読み取りと書き込みを同時に行う必要がある場合
- ストリーム処理を利用して、メモリ使用量を最小限に抑えたい場合

選択のポイント

ファイルサイズ: 小規模なファイルにはDOM、大規模なファイルにはSAXまたはStAXを選ぶ。
メモリ効率: メモリ使用量を重視する場合はSAXまたはStAXを選択。
データ操作の頻度: データの読み取りと書き込みを頻繁に行う場合はDOMを選択。
処理の柔軟性: 双方向の処理が必要な場合はStAXを選択。

これらのポイントを考慮し、プロジェクトの要件に最適なXMLパーサーを選ぶことで、効率的なデータ処理が可能になります。

各パーサーの特性を理解し、適切な選択を行うことが成功の鍵です。

まとめ

この記事では、Javaを使用してXMLをパースする方法について、DOM、SAX、StAXの各パーサーの特徴や使用シーンを詳しく解説しました。

XMLパースの際には、ファイルのサイズやメモリ効率、データ操作の頻度に応じて適切なパーサーを選ぶことが重要であり、それぞれのパーサーには独自の利点があります。

これらの情報をもとに、実際のプロジェクトでXMLデータを効率的に処理するための選択を行ってみてください。

2025-04-15更新日: 2025-04-15

XMLパースとは何か

JavaでXMLをパースする方法の選択肢

DOMパーサーを使ったXMLパースの手順

必要なライブラリのインポート

XMLファイルの読み込み

XMLデータの解析

サンプルXMLファイル

SAXパーサーを使ったXMLパースの手順

必要なライブラリのインポート

SAXハンドラーの作成

XMLファイルの読み込み

サンプルXMLファイル

StAXパーサーを使ったXMLパースの手順

必要なライブラリのインポート

XMLファイルの読み込み

XMLデータの解析

サンプルXMLファイル

XMLパース時の注意点

XMLの構文エラー

文字エンコーディング

大規模なXMLファイルの処理

名前空間の扱い

エラーハンドリング

XMLのバージョン管理

実践例：簡単なXMLパースのサンプルコード

サンプルXMLファイル

どのパーサーを選ぶべきか

DOMパーサー

SAXパーサー

StAXパーサー

選択のポイント

まとめ

関連記事