设为首页收藏本站

运维网»论坛 › 【开发测试】 › Perl › perl中XML：接口篇

Centos6.5×64安装配置openmeetings3.0.3详

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

查看: 1380|回复: 0

[经验分享] perl中XML：接口篇

尚未签到

发表于 2017-5-18 07:15:25 | 显示全部楼层 |阅读模式

翻译：fayland
出处：中国 Perl 协会 FPC - PerlChina.org
原名：Perl XML Quickstart: The Perl XML Interfaces
中文：中文名称
作者：Kip Hampton
原文：http://www.xml.com/pub/a/2001/04/18/perlxmlqstart1.html
发表：2001-04-18
Perlchina 提醒您：请保护作者的著作权,维护作者劳动的结晶。

　　

目录

[隐藏]

1 入门简介
2 任务
3 任务一：提取数据
4 任务二：创建一个XML文档
5 XML Perl专用接口例子
- 5.1 XML::Simple
  - 5.1.1 读
  - 5.1.2 写
- 5.2 XML::SimpleObject
  - 5.2.1 读
  - 5.2.2 写
- 5.3 XML::TreeBuilder
  - 5.3.1 读
  - 5.3.2 写
- 5.4 XML::Twig
  - 5.4.1 读
  - 5.4.2 写
6 资源

<script type="text/javascript"> if (window.showTocToggle) { var tocShowText = "显示"; var tocHideText = "隐藏"; showTocToggle(); } </script>　　

[编辑] 入门简介

　　最近在Perl-XML邮件组经常问起的问题是如何给不熟悉的用户一个对大量 Perl XML 模块的快速指引性概述文档。在接下来的几个月里我将单独对此问题写几篇专栏文章。 CPAN上的XML模块可以分成三大类：对 XML 数据提供独特的接口（通常有关在XML实例和Perl数据之间的转换），实现某一标准XML API的模块，和对一些特定的XML相关任务进行简化的特殊用途模块。这个月我们先关注第一个，XML Perl专用接口。
　　use Disclaimer qw(:standard);
　　此文档不是为了对模块性能进行基准测试，我的目的也不是暗示某一模块比另一个模块更有用。为你的项目选择正确的 XML 模块更多依赖于项目本身和你积累的经验。不同的接口适应于不同的任务和不同的人。我的唯一目的是通过定义两个简单的任务，然后提供不同借口的可运行例子来显示如何获得同样的最终结果。

[编辑] 任务

　　虽然XML的用途非常多，但大部分XML相关任务可分成两组：一是从已有的XML文档提取数据，另一个是使用其他资源的数据创建一个新的XML文档。既然如此，我们所用来介绍不同模块的例子将由“从一个XML文件中提取某一特定数据集”和“将一Perl数据结构转为某一特定XML格式”组成。

[编辑] 任务一：提取数据

　　首先，假设有如下XML片断：

<?xml version="1.0"?>
<camelids>
<species name="Camelus dromedarius">
<common-name>Dromedary, or Arabian Camel</common-name>
<physical-characteristics>
<mass>300 to 690 kg.</mass>
<appearance>
The dromedary camel is characterized by a long-curved
neck, deep-narrow chest, and a single hump.
...
</appearance>
</physical-characteristics>
<natural-history>
<food-habits>
The dromedary camel is an herbivore.
...
</food-habits>
<reproduction>
The dromedary camel has a lifespan of about 40-50 years
...
</reproduction>
<behavior>
With the exception of rutting males, dromedaries show
very little aggressive behavior.
...
</behavior>
<habitat>
The camels prefer desert conditions characterized by a
long dry season and a short rainy season.
...
</habitat>
</natural-history>
<conservation status="no special status">
<detail>
Since the dromedary camel is domesticated, the camel has
no special status in conservation.
</detail>
</conservation>
</species>
...
</camelids>

　　现在我们假设此完整文档（可从本月例子代码中获取）包含骆驼家族所有成员的全部信息，而不仅仅是上面的单峰骆驼信息。为了举例说明每一模块是如何从此文件中提取某一数据子集，我们将写一个很简短的脚本来处理camelids.xml文档和在STDOUT上输出我们找到的每一种类的普通名（common-name），拉丁名（用括号包起来），和当前保存状况。因此，处理完整个文档，每一个脚本的输出应该为如下结果：

Bactrian Camel (Camelus bactrianus) endangered
Dromedary, or Arabian Camel (Camelus dromedarius) no special status
Llama (Lama glama) no special status
Guanaco (Lama guanicoe) special concern
Vicuna (Vicugna vicugna) endangered

[编辑] 任务二：创建一个XML文档

　　为了示范每一模块是如何从其他数据源中创建新的XML文档，我们将写一个小脚本将一个简单的Perl hash转换为一个简单的XHTML文档。hash里包含一些指向很cool的特定相关骆驼的网页的URLs。
　　Hash 如下：

my %camelid_links = (
one => { url       => '
http://www.online.discovery.com/news/picture/may99/photo20.html',
description => 'Bactrian Camel in front of Great ' .
'Pyramids in Giza, Egypt.'},
two => { url       => 'http://www.fotos-online.de/english/m/09/9532.htm',
description => 'Dromedary Camel illustrates the ' .
'importance of accessorizing.'},
three => { url       => 'http://www.eskimo.com/~wallama/funny.htm',
description => 'Charlie - biography of a narcissistic llama.'},
four  => { url       => 'http://arrow.colorado.edu/travels/other/turkey.html',
description => 'A visual metaphor for the perl5-porters ' .
'list?'},
five  => { url       => 'http://www.galaonline.org/pics.htm',
description => 'Many cool alpacas.'},
six => { url       => 'http://www.thpf.de/suedamerikareise/galerie/vicunas.htm',
description => 'Wild Vicunas in a scenic landscape.'}
);

　　而我们所期望从hash中创建的文档例子为：

<?xml version="1.0">
<html>
<body>
[http://www.eskimo.com/~wallama/funny.htm">Charlie -
biography of a narcissistic llama.]
[http://www.online.discovery.com/news/picture/may99/photo20.html">Bactrian
Camel in front of Great Pyramids in Giza, Egypt.]
[http://www.fotos-online.de/english/m/09/9532.htm">Dromedary
Camel illustrates the importance of accessorizing.]
[http://www.galaonline.org/pics.htm">Many cool alpacas.]
[http://arrow.colorado.edu/travels/other/turkey.html">A visual
metaphor for the perl5-porters list?]
[http://www.thpf.de/suedamerikareise/galerie/vicunas.htm">Wild
Vicunas in a scenic landscape.]
</body>
</html>

　　良好缩进的XML结果文件（如上面所显示的）对于阅读很重要，但这种良好的空格处理不是我们案例所要求的。我们所关心的是结果文档是结构良好的/well-formed和它正确地表现了hash里的数据。
　　任务定义完毕，接下来该是代码例子的时候了。

[编辑] XML Perl专用接口例子

[编辑] XML::Simple

　　最初创建用来简化读写XML格式配置文件的XML::Simple, 在转换XML文档和Perl数据结构之间没有另外的抽象接口。所有的元素和属性都可以通过嵌套的引用直接读取。

[编辑] 读

use XML::Simple;
my $file = 'files/camelids.xml';
my $xs1 = XML::Simple->new();
my $doc = $xs1->XMLin($file);
foreach my $key (keys (%{$doc->{species}})){
print $doc->{species}->{$key}->{'common-name'} . ' (' . $key . ') ';
print $doc->{species}->{$key}->{conservation}->final . "/n";
}

[编辑] 写

use XML::Simple;
require "files/camelid_links.pl";
my %camelid_links = get_camelid_data();
my $xsimple = XML::Simple->new();
print $xsimple->XMLout(/%camelid_links,
noattr => 1,
xmldecl => '<?xml version="1.0">');

　　这数据到文档的任务的条件要求暴露了XML::Simple的一个弱点：它没有允许我们决定hash里的哪个key应该作为元素返回和哪个key该作为属性返回。上面例子的输出虽然接近我们的输出要求但还远远不够。对于那些更喜欢将XML文档内容直接作为Perl数据结构操作，而且需要在输出方面做更细微控制的案例，XML::Simple和XML::Writer配合得很好。如下例子说明了如何使用XML::Write来符合我们的输出要求。

use XML::Writer;
require "files/camelid_links.pl";
my %camelid_links = get_camelid_data();
my $writer = XML::Writer->new();
$writer->xmlDecl();
$writer->startTag('html');
$writer->startTag('body');
foreach my $item ( keys (%camelid_links) ) {
$writer->startTag('a', 'href' => $camelid_links{$item}->{url});
$writer->characters($camelid_links{$item}->{description});
$writer->endTag('a');
}
$writer->endTag('body');
$writer->endTag('html');
$writer->end();

[编辑] XML::SimpleObject

　　XML::SimpleObject 对XML数据使用回想文档对象模型（Document Object Model）的存取器/accessor来提供一个面对对象接口。

[编辑] 读

use XML::Parser;
use XML::SimpleObject;
my $file = 'files/camelids.xml';
my $parser = XML::Parser->new(ErrorContext => 2, Style => "Tree");
my $xso = XML::SimpleObject->new( $parser->parsefile($file) );
foreach my $species ($xso->child('camelids')->children('species')) {
print $species->child('common-name')->{VALUE};
print ' (' . $species->attribute('name') . ') ';
print $species->child('conservation')->attribute('status');
print "/n";
}

[编辑] 写

　　XML::SimpleObject 没有通过抓取来创建XML文档的功能。但是与上面的XML::Simple例子一样，可以通过与XML::Writer配合简单的完成任务。

[编辑] XML::TreeBuilder

　　XML::TreeBuilder 包由两模块组成：XML::Element用来创建和获得XML元素点的内容和XML::TreeBuilder作为一个工厂包从已有XML文件中简化文档树的创建。对于那些已有值得尊敬的 HTML::Element 和 HTML::Tree 模块使用经验的人来说，使用 XML::TreeBuilder 是非常容易的，因为除了XML特有的方法外其他都是一样的。

[编辑] 读

use XML::TreeBuilder;
my $file = 'files/camelids.xml';
my $tree = XML::TreeBuilder->new();
$tree->parse_file($file);
foreach my $species ($tree->find_by_tag_name('species')){
print $species->find_by_tag_name('common-name')->as_text;
print ' (' . $species->attr_get_i('name') . ') ';
print $species->find_by_tag_name('conservation')->attr_get_i('status');
print "/n";
}

[编辑] 写

use XML::Element;
require "files/camelid_links.pl";
my %camelid_links = get_camelid_data();

my $root = XML::Element->new('html');
my $body = XML::Element->new('body');
my $xml_pi = XML::Element->new('~pi', text => 'xml version="1.0"');
$root->push_content($body);
foreach my $item ( keys (%camelid_links) ) {
my $link = XML::Element->new('a', 'href' => $camelid_links{$item}->{url});
$link->push_content($camelid_links{$item}->{description});
$body->push_content($link);
}
print $xml_pi->as_XML;
print $root->as_XML();

[编辑] XML::Twig

　　XML::Twig 与其他只有Perl的XML接口不同，它是一个除了标准的XML APIs 外还有其它富有创造性特点的Perlish接口。需要更多更详细的介绍请查看XML.com 文章

[编辑] 读

use XML::Twig;
my $file = 'files/camelids.xml';
my $twig = XML::Twig->new();
$twig->parsefile($file);
my $root = $twig->root;
foreach my $species ($root->children('species')){
print $species->first_child_text('common-name');
print ' (' . $species->att('name') . ') ';
print $species->first_child('conservation')->att('status');
print "/n";
}

[编辑] 写

use XML::Twig;
require "files/camelid_links.pl";
my %camelid_links = get_camelid_data();
my $root = XML::Twig::Elt->new('html');
my $body = XML::Twig::Elt->new('body');
$body->paste($root);
foreach my $item ( keys (%camelid_links) ) {
my $link = XML::Twig::Elt->new('a');
$link->set_att('href', $camelid_links{$item}->{url});
$link->set_text($camelid_links{$item}->{description});
$link->paste('last_child', $body);
}
print qq|<?xml version="1.0"?>|;
$root->print;

　　这些例子举例说明了这些普通XML Perl模块的基本使用方法。我的目标是提供足够多的例子让你感受怎么用每个模块写代码。下个月我们将关注“实现某一标准XML API的模块”，特别说明的，XML::DOM, XML::XPath 和其他大量的 SAX 和类SAX模块。

[编辑] 资源

下载案例代码
CPAN上XML模块的完整列表
Perl-XML邮件组档案
使用XML::Twig
Second Part: Perl XML Quickstart: The Standard XML Interfaces

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表，该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有，请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意，请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息，一经发现立即删除。若您因此触犯法律，一切后果自负，我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集，我们仅提供一个展示、介绍、观摩学习的平台，我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责，亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏，不得用于商业或者其他用途，否则，一切后果均由您自己承担，我们对此不承担任何法律责任
7、如涉及侵犯版权等问题，请您及时通知我们，我们将立即采取措施予以解决
8、联系人Email：admin@iyunv.com 网址：www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址：https://www.yunweiku.com/thread-378554-1-1.html 上篇帖子： Perl 的简单语法下篇帖子： perl-多文件一次更新

回复

使用道具举报

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群，最新一手资源尽在官方微信交流群！快快加入我们吧...

扫描微信二维码查看详情

客服 E-mail:iyunvcom@gmail.com

本站由青云提供云计算服务

运维网--中国最专业的运维工程师交流社区

豫ICP备20007574号-1 Copyright © 2012-2025

Good Good

Study

Day Day

UP

客服E-mail:kefu@iyunv.com 客服QQ：1061981298

QQ群⑦： QQ群⑧： k8s群：

提醒：禁止发布任何违反国家法律、法规的言论与图片等内容；本站内容均来自个人观点与网络等信息，非本站认同之观点.

本站大部分资源是网友从网上搜集分享而来，其版权均归原作者及其网站所有，我们尊重他人的合法权益，如有内容侵犯您的合法权益，请及时与我们联系进行核实删除！

合作伙伴:

快速回复 返回顶部 返回列表