编程知识 购物 网址 新闻 笑话 | 软件 日历 阅读 图书馆 China
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
vbs/VBScript DOS/BAT hta htc python perl 游戏相关 VBA 远程脚本 ColdFusion ruby专题 autoit seraphzone PowerShell linux shell Lua Golang Erlang 其它教程 CSS/HTML/Xhtml html5 CSS XML/XSLT Dreamweaver教程 经验交流
站长资讯 .NET新手 ASP.NET C# WinForm Silverlight WCF CLR WPF XNA VisualStudio ASP.NET-MVC .NET控件开发 EntityFramework WinRT-Metro Java C++ PHP Delphi Python Ruby C语言 Erlang Go Swift Scala R语言 Verilog 其它语言 架构设计 面向对象 设计模式 领域驱动 Html-Css JavaScript jQuery HTML5 SharePoint GIS技术 SAP OracleERP DynamicsCRM K2 BPM 信息安全 企业信息 Android开发 iOS开发 WindowsPhone WindowsMobile 其他手机 敏捷开发 项目管理 软件工程 SQLServer Oracle MySQL NoSQL 其它数据库 Windows7 WindowsServer Linux
   -> ruby专题 -> Ruby中使用Nokogiri包来操作XML格式数据的教程 -> 正文阅读

[ruby专题]Ruby中使用Nokogiri包来操作XML格式数据的教程

这篇文章主要介绍了Ruby中使用Nokogiri包来操作XML格式数据的教程,Nokogiri是一个gem包,Nokogiri可以依靠XPath和CSS3选择器方式来实现搜索功能,比较强大,需要的朋友可以参考下
安装
对于Ubuntu,需要安装好 libxml2, libxslt 这两个组件:

$ apt-get install libxml2 libxslt


然后就可以:

$ gem install nokogiri


可选项
nokogiri提供了一些解析文件时的可选项,常用的有:
NOBLANKS : 删除空节点 NOENT : 替代实体 NOERROR : 隐藏错误报告 STRICT : 精确解析,当解析到文件异常时抛出错误 NONET : 在解析期间禁止任何网络连接.
可选项使用方式举例(通过块调用):

doc = Nokogiri::XML(File.open("blossom.xml")) do |config|
config.strict.nonet
end

或者

doc = Nokogiri::XML(File.open("blossom.xml")) do |config|
config.options = Nokogiri::XML::ParseOptions::STRICT | Nokogiri::XML::ParseOptions::NONET
end

解析
可以从文件,字符串,URL等来解析。靠的是这两个方法 Nokogiri::HTML, Nokogiri::XML:
读取字符串:

html_doc = Nokogiri::HTML("<html><body><h1>Mr. Belvedere Fan Club</h1></body></html>")
xml_doc = Nokogiri::XML("<root><aliens><alien><name>Alf</name></alien></aliens></root>")

读取文件:

f = File.open("blossom.xml")
doc = Nokogiri::XML(f)
f.close

读取URL:

require 'open-uri'
doc = Nokogiri::HTML(open("http://www.threescompany.com/"))

寻找节点
可以使用XPATH 以及 CSS selector 来搜索: 例如,给定一个XML:

<books>
 <book>
 <title>Stars</title>
 </book>
 <book>
 <title>Moon</title>
 </book>
</books>


xpath:

@doc.xpath("//title")


css:

@doc.css("book title")


修改节点内容

title = @doc.css("book title").firsto
title.content = 'new title'
puts @doc.to_html

# =>
...
 <title>new title</title>
...


修改节点的结构

first_title = @doc.at_css('title')
second_book = @doc.css('book').last

# 可以把第一个title放到第二个book中
first_title.parent = second_book

# 也可以随意摆放。
second_book.add_next_sibling(first_title)

# 也可以修改对应的class
first_title.name = 'h2'
first_title['class']='red_color'
puts @doc.to_html
# => <h2 class='red_color'>...</h2>

# 也可以新建一个node
third_book = Nokogiri::XML::Node.new 'book', @doc
third_book.content = 'I am the third book'
second_book.add_next_sibling third_book
puts @doc.to_html
# =>
...
<books>
 ...
 <book>I am the third book</book>
</books>


  ruby专题 最新文章
最新的CocoaPods安装教程
Rails实现字段加密存储
mac及linux下搭建ruby+rails环境
redis集群搭建教程及遇到的问题处理
ruby中并发并行与全局锁详解
Redis集群搭建全记录
Windows下安装配置Ruby的debug工具ruby-deb
使用Ruby实现FTP密码破解
Ruby中的public、private、protected区别小
Ruby实现网页图片抓取
上一篇文章      下一篇文章      查看所有文章
加:2016-11-09 22:54:50  更:2017-05-14 02:00:28 
 
360图书馆 软件开发资料 购物精选 新闻资讯 Chinese Culture 龙发科技 开发 中国文化 阅读网 日历 万年历 2021年1日历
2021-1-27 15:51:45
多播视频美女直播
↓电视,电影,美女直播,迅雷资源↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  编程知识