当前位置:  编程技术>python

python操作xml文件详细介绍

    来源: 互联网  发布时间:2014-10-07

    本文导语:  关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。 一、什么是xml? xml即可扩展标记语言,它...

关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码。这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件。

一、什么是xml?

xml即可扩展标记语言,它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。

abc.xml

代码如下:



    4
   
        Python
       
            测试
       
   
   
        Zope
   

Ok ,从结构上,它很像我们常见的HTML超文本标记语言。但他们被设计的目的是不同的,超文本标记语言被设计用来显示数据,其焦点是数据的外观。它被设计用来传输和存储数据,其焦点是数据的内容。

那么它有如下特征:

首先,它是有标签对组成,

标签可以有属性:

标签对可以嵌入数据:abc

标签可以嵌入子标签(具有层级关系):

二、获得标签属性

那么,下面来介绍如何用python来读取这种类型的文件。

代码如下:

#coding=utf-8
import  xml.dom.minidom

#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象
root = dom.documentElement
print root.nodeName
print root.nodeValue
print root.nodeType
print root.ELEMENT_NODE

mxl.dom.minidom 模块被用来处理xml文件,所以要先引入。

xml.dom.minidom.parse() 用于打开一个xml文件,并将这个文件对象dom变量。

documentElement 用于得到dom对象的文档元素,并把获得的对象给root

每一个结点都有它的nodeName,nodeValue,nodeType属性。

nodeName为结点名字。

nodeValue是结点的值,只对文本结点有效。

nodeType是结点的类型。catalog是ELEMENT_NODE类型

现在有以下几种:

'ATTRIBUTE_NODE'
'CDATA_SECTION_NODE'
'COMMENT_NODE'
'DOCUMENT_FRAGMENT_NODE'
'DOCUMENT_NODE'
'DOCUMENT_TYPE_NODE'
'ELEMENT_NODE'
'ENTITY_NODE'
'ENTITY_REFERENCE_NODE'
'NOTATION_NODE'
'PROCESSING_INSTRUCTION_NODE'
'TEXT_NODE'


三、获得子标签

现在要获得catalog的子标签以的标签name

代码如下:



       4
      
              Python
            
                    测试
           
   
   
            Zope
   

对于知道元素名字的子元素,可以使用getElementsByTagName方法获取:

代码如下:

#coding=utf-8
import  xml.dom.minidom

#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象
root = dom.documentElement

bb = root.getElementsByTagName('maxid')
b= bb[0]
print b.nodeName

bb = root.getElementsByTagName('login')
b= bb[0]
print b.nodeName

如何区分相同标签名字的标签:

代码如下:



       4
      
              Python
            
                    测试
           
   
   
            Zope
   

和标签不止一个如何区分?

代码如下:

#coding=utf-8
import  xml.dom.minidom

#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象
root = dom.documentElement

bb = root.getElementsByTagName('caption')
b= bb[2]
print b.nodeName

bb = root.getElementsByTagName('item')
b= bb[1]
print b.nodeName

root.getElementsByTagName('caption') 获得的是标签为caption 一组标签,b[0]表示一组标签中的第一个;b[2] ,表示这一组标签中的第三个。

四、获得标签属性值

代码如下:



       4
      
              Python
            
                    测试
           
   
   
            Zope
   

和标签是有属性的,如何获得他们的属性?

代码如下:

#coding=utf-8
import  xml.dom.minidom

#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象
root = dom.documentElement

itemlist = root.getElementsByTagName('login')
item = itemlist[0]
un=item.getAttribute("username")
print un
pd=item.getAttribute("passwd")
print pd

ii = root.getElementsByTagName('item')
i1 = ii[0]
i=i1.getAttribute("id")
print i

i2 = ii[1]
i=i2.getAttribute("id")
print i

getAttribute方法可以获得元素的属性所对应的值。

五、获得标签对之间的数据

代码如下:



       4
      
              Python
            
                    测试
           
   
   
            Zope
   

标签对之间是有数据的,如何获得这些数据?

获得标签对之间的数据有多种方法,

方法一:

代码如下:

#coding=utf-8
import  xml.dom.minidom

#打开xml文档
dom = xml.dom.minidom.parse('abc.xml')

#得到文档元素对象
root = dom.documentElement

cc=dom.getElementsByTagName('caption')
c1=cc[0]
print c1.firstChild.data

c2=cc[1]
print c2.firstChild.data

c3=cc[2]
print c3.firstChild.data

firstChild 属性返回被选节点的第一个子节点,.data表示获取该节点人数据。

方法二:

代码如下:

#coding=utf-8
from xml.etree import ElementTree as ET
per=ET.parse('abc.xml')
p=per.findall('./login/item')

for oneper in p:
    for child in oneper.getchildren():
        print child.tag,':',child.text


p=per.findall('./item')

for oneper in p:
    for child in oneper.getchildren():
        print child.tag,':',child.text

方法二有点复杂,所引用模块也与前面的不一样,findall用于指定在哪一级标签下开始遍历。

getchildren方法按照文档顺序返回所有子标签。并输出标签名(child.tag)和标签的数据(child.text)

其实,方法二的作用不在于此,它核心功能是可以遍历某一级标签下的所有子标签。


    
 
 

您可能感兴趣的文章:

  • 在Python3中使用urllib实现http的get和post提交数据操作
  • python读取csv文件示例(python操作csv)
  • python字符串格式化输出及相关操作代码举例
  • Python文件操作类操作实例详解
  • python读文件,写文件操作以及目录操作
  • 使用python删除nginx缓存文件示例(python文件操作)
  • python 布尔操作实现代码
  • python 操作postgresql的pgdb库的问题
  • python文件读写并使用mysql批量插入示例分享(python操作mysql)
  • 网络技术 iis7站长之家
  • python读写文件操作示例程序
  • Python 调用DLL操作抄表机
  • Python操作json数据的一个简单例子
  • 简单文件操作python 修改文件指定行的方法
  • python目录操作之python遍历文件夹后将结果存储为xml
  • Python中列表(list)操作方法汇总
  • Python 文件操作实现代码
  • Python 字符串操作实现代码(截取/替换/查找/分割)
  • python ElementTree 基本读操作示例
  • python中常用的各种数据库操作模块和连接实例
  • Python 文件操作技巧(File operation) 实例代码分析
  • python异常信息堆栈输出到日志文件
  • 用python代码做configure文件
  • python遍历文件夹并删除特定格式文件的示例
  • Python引用(import)文件夹下的py文件的方法
  • python安装问题,rpm命令显是缺少库文件
  • python代码制作configure文件示例
  • python使用循环实现批量创建文件夹示例
  • python 改文件名等问题
  • python 获取文件列表(或是目录例表)
  • Python批量修改文件后缀的方法
  •  
    本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术,将尽最大努力为读者提供更好的信息聚合和浏览方式。
    本站(WWW.)站内文章除注明原创外,均为转载、整理或搜集自网络。欢迎任何形式的转载,转载请注明出处。












  • 相关文章推荐
  • python之平台独立的调试工具winpdb介绍
  • python基础教程之基本内置数据类型介绍
  • 基于python实现的网络爬虫功能:自动抓取网页介绍
  • easy_install python包安装管理工具介绍
  • python中的深拷贝(deepcopy)和浅拷贝(copy)介绍及代码参考
  • 详细介绍Python语言中的按位运算符
  • Python类的构造函数,析构函数以及垃圾回收机制详细介绍及代码举例
  • python strip()函数 介绍
  • python对XML的解析方法(SAX,DOM,ElementTree)介绍
  • python 多线程应用介绍
  • Python sys.path详细介绍
  • python基础教程之缩进介绍
  • python的id()函数介绍
  • python基础教程之基本数据类型和变量声明介绍
  • Python 变量类型及命名规则介绍
  • python进阶教程之模块(module)介绍
  • python中的五种异常处理机制介绍
  • python基础教程之循环介绍
  • Python中条件选择和循环语句使用方法介绍
  • python基础教程之自定义函数介绍
  • python中的内置函数getattr()介绍及示例
  • Python GUI编程:tkinter实现一个窗口并居中代码
  • 让python同时兼容python2和python3的8个技巧分享
  • Python不使用print而直接输出二进制字符串
  • 使用setup.py安装python包和卸载python包的方法
  • Python中实现json字符串和dict类型的互转
  • 不小心把linux自带的python卸载了,导致安装一个依赖原python的软件不能安装,请问该怎么办?
  • python下用os.execl执行centos下的系统时间同步命令ntpdate
  • Python开发者社区整站源码 Pythoner
  • Python namedtuple对象json序列化/反序列化及对象恢复
  • python基础教程之python消息摘要算法使用示例


  • 站内导航:


    特别声明:169IT网站部分信息来自互联网,如果侵犯您的权利,请及时告知,本站将立即删除!

    ©2012-2021,,E-mail:www_#163.com(请将#改为@)

    浙ICP备11055608号-3