您在这里:首页 > 深入 Python > XML 处理 > 搜索元素 | << >> | ||||
深入 Python从 Python 新手到专家 |
通过遍历每个节点来遍历 XML 文档可能会很乏味。如果您正在寻找 XML 文档深处埋藏的特定内容,可以使用一个快捷方式快速找到它:getElementsByTagName。
在本节中,您将使用 binary.xml 语法文件,如下所示
<?xml version="1.0"?>
<!DOCTYPE grammar PUBLIC "-//diveintopythonbook.pythonlang.cn//DTD Kant Generator Pro v1.0//EN" "kgp.dtd">
<grammar>
<ref id="bit">
<p>0</p>
<p>1</p>
</ref>
<ref id="byte">
<p><xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/>\
<xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/></p>
</ref>
</grammar>
它有两个 ref,'bit' 和 'byte'。一个 bit 是 '0' 或 '1',一个 byte 是 8 个 bit。
>>> from xml.dom import minidom >>> xmldoc = minidom.parse('binary.xml') >>> reflist = xmldoc.getElementsByTagName('ref')>>> reflist [<DOM Element: ref at 136138108>, <DOM Element: ref at 136144292>] >>> print reflist[0].toxml() <ref id="bit"> <p>0</p> <p>1</p> </ref> >>> print reflist[1].toxml() <ref id="byte"> <p><xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/>\ <xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/></p> </ref>
>>> firstref = reflist[0]>>> print firstref.toxml() <ref id="bit"> <p>0</p> <p>1</p> </ref> >>> plist = firstref.getElementsByTagName("p")
>>> plist [<DOM Element: p at 136140116>, <DOM Element: p at 136142172>] >>> print plist[0].toxml()
<p>0</p> >>> print plist[1].toxml() <p>1</p>
>>> plist = xmldoc.getElementsByTagName("p")>>> plist [<DOM Element: p at 136140116>, <DOM Element: p at 136142172>, <DOM Element: p at 136146124>] >>> plist[0].toxml()
'<p>0</p>' >>> plist[1].toxml() '<p>1</p>' >>> plist[2].toxml()
'<p><xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/>\ <xref id="bit"/><xref id="bit"/><xref id="bit"/><xref id="bit"/></p>'
<< Unicode |
| 1 | 2 | 3 | 4 | 5 | 6 | 7 | |
访问元素属性 >> |