这篇文章主要介绍了Ruby使用REXML库来解析xml格式数据的方法,文章最后提及了REXML库的使用相关安全问题可以注意一下,需要的朋友可以参考下

REXML 是一个完全用ruby写的processor ,他有多种api,其中两个经典的api是通过DOM-like 和SAX-like 来进行区分的。第一种是将整个文件读进内存,然后存储为一个分层的形式(也就是一棵树了).而第二种是"parse as you go",当你的文件很大,并且内存受到限制的时候,比较适合用这种。
rexml具有如下特点:

  • 100%用ruby编写
  • 可以用来解析SAX和DOM
  • 轻量,不足2000行代码
  • 提供完整的API支持
  • ruby中内置

下面我们来看看如何使用它,假设我们有如下xml文件:

<collection shelf="New Arrivals">
 <movie title="Enemy Behind">
 <type>War, Thriller</type>
 <format>DVD</format>
 <year>2003</year>
 <rating>PG</rating>
 <stars>10</stars>
 <description>Talk about a US-Japan war</description>
 </movie>
 <movie title="Transformers">
 <type>Anime, Science Fiction</type>
 <format>DVD</format>
 <year>1989</year>
 <rating>R</rating>
 <stars>8</stars>
 <description>A schientific fiction</description>
 </movie>
 <movie title="Trigun">
 <type>Anime, Action</type>
 <format>DVD</format>
 <episodes>4</episodes>
 <rating>PG</rating>
 <stars>10</stars>
 <description>Vash the Stampede!</description>
 </movie>
 <movie title="Ishtar">
 <type>Comedy</type>
 <format>VHS</format>
 <rating>PG</rating>
 <stars>2</stars>
 <description>Viewable boredom</description>
 </movie>
</collection>

解析DOM:

require 'rexml/document'
include REXML
xmlfile = File.new("movies.xml")
xmldoc = Document.new(xmlfile)
root = xmldoc.root
puts "Root element : " + root.attributes["shelf"]
xmldoc.elements.each("collection/movie"){
 |e| puts "Movie Title : " + e.attributes["title"]
}
xmldoc.elements.each("collection/movie/type") {
 |e| puts "Movie Type : " + e.text
}
xmldoc.elements.each("collection/movie/description") {
 |e| puts "Movie Description : " + e.text
}

使用XPATH:

require 'rexml/document'
include REXML
xmlfile = File.new("movies.xml")
xmldoc = Document.new(xmlfile)
movie = XPath.first(xmldoc, "//movie")
p movie
XPath.each(xmldoc, "//type") { |e| puts e.text }
names = XPath.match(xmldoc, "//format").map {|x| x.text }
p names

以备不时之需!

PS:关于REXML的安全问题
Ruby官方网站在8月23日发布了安全通告:http://www.ruby-lang.org/en/news/2008/08/23/dos-vulnerability-in-rexml/,在Ruby当前使用的XML解析库REXML在解析具有嵌套递归元素的XML文件的时候,将会出现拒绝服务攻击的缺陷,导致服务器资源耗尽!
凡是在Rails应用程序当中使用到了XML文件解析功能的都存在上述缺陷,需要进行修复。在Rails当中的修复办法如下:
1、Rails2.0.2和以前的老版本
下载修复文件,拷贝到RAILS_ROOT/lib目录下,并且在environment.rb当中加入语句

require ‘rexml-expansion-fix'

2、Rails 2.1.0以上版本
pk10开奖结果 下载修复文件,拷贝到RAILS_ROOT/config/initializers目录下即可。

最新资讯
小盒科技CEO刘夜谈AI课:技术背后 人文很重要

小盒科技CEO刘夜谈AI

近日作业盒子举办品牌升级暨战略发布会,宣布了“作业盒
阿里回港二次上市:将和港股“股王”腾讯强势对垒?

阿里回港二次上市:将和

时间倒回至5年前,2014年9月15日,阿里在纽交所递交IPO申
人类登月50周年:致敬那些为登月献出的生命

人类登月50周年:致敬那

整整50年了,距离人类首次登上月球。
又一暴雪联合创始人宣布离职:结束28年暴雪工作生涯

又一暴雪联合创始人宣

今天上午,暴雪娱乐的联合创始人之一Frank Pearce宣布正
快递员不得随意将包裹放快件箱,能否终结懒人送件

快递员不得随意将包裹

未经收件人同意,快递员将不得随意把包裹放进智能快件箱
苹果面临“果粉”忠诚度下降危机

苹果面临“果粉”忠诚

高盛指出,由于App商店的销售业绩增长缓慢,苹果股价恐怕
最新文章
Ruby编写HTML脚本替换小程序的实例分享

Ruby编写HTML脚本替换

这篇文章主要介绍了Ruby编写HTML脚本替换小程序的实例
解析proxy代理模式在Ruby设计模式开发中的运用

解析proxy代理模式在R

这篇文章主要介绍了proxy代理模式在Ruby设计模式开发
Ruby on Rails中Rack中间件的基础学习教程

Ruby on Rails中Rack

Rack是一个连接Ruby程序与服务器程序之间的中间件,甚
以MVC的思维方式来理解Ruby on Rails框架的设计结构

以MVC的思维方式来理

RubyonRails是Ruby世界中Web开发框架的代名词,人气相
Ruby基本的环境变量设置以及常用解释器命令介绍

Ruby基本的环境变量设

这篇文章主要介绍了Ruby基本的环境变量设置以及常用解
Ruby的基础语法入门学习教程

Ruby的基础语法入门学

这篇文章主要介绍了Ruby的基础语法入门学习教程,包括
pk10开奖结果_ZPmvM pk10开奖结果_FYRPQFh pk10开奖结果_YX11hzy pk10开奖结果_n35TLX pk10开奖结果_hNpNS pk10开奖结果pk10开奖结果_Ojox0 pk10开奖结果_1KmAlRB pk10开奖结果_DsdU8 pk10开奖结果_4HCGrI0 pk10开奖结果_vuJFM