perl 用 XML::Parser 解析 XML文件,访问哈希

本篇我们会看到 Perl 成为知名编程语言的关键特色--哈希 hash(2000年以前叫:关联数组)。

在Perl 中,可以使用各种模块和函数来解析 XML元素和属性。其中,最古老的模块是 XML::Parser,它提供了一组完整的XML解析和处理函数,可以解析XML文档中的元素和属性。

例如,下面是一个使用 XML::Parser 模块解析 XML元素和属性 的示例代码:

编写 xml_parser_tree.pl 如下

perl 复制代码
#!/usr/bin/perl
use 5.010;
use strict;
use warnings;
use utf8;
use XML::Parser;
use Data::Dumper;

if ($#ARGV != 0){
    die "You must specify a file.xml to parse";
}
my $file = shift @ARGV;
# Tree 风格比较难用,它的数据结构不符合标准的JSON.
my $p = XML::Parser->new(Style => 'Tree',
        Handlers => {Start => \&start, End => \&end_, Char => \&text});
my $tree = $p->parsefile($file) 
            or die "cannot read file.xml\n";
#print Dumper($tree);

my $f2 = $file .'.txt';
# 写入文件
open(my $fw, '>:encoding(UTF-8)', $f2) or die "cannot open file '$f2' $!";
my @array;
# 访问 hash
sub start { 
    my ($self, $tag, %attribs) = @_;
    if ($tag eq 'node'){
        push @array, $attribs{'TEXT'};
    }
}
sub end_ {
    my ($self, $tag) = @_;
}
sub text {
    my ($self, $text) = @_;
}
my $ln =0; # 行数
foreach my $txt (@array){
    print $fw $txt ."\n";
    $ln++;
}
close($fw);
print $ln;

运行 perl xml_parser_tree.pl your_test.xml

编写 xml_parser_subs.pl 如下

perl 复制代码
#!/usr/bin/perl
use 5.010;
use strict;
use warnings;
use utf8;
use XML::Parser;
#use Data::Dumper;

if ($#ARGV != 0){
    die "You must specify a file.xml to parse";
}
my $file = shift @ARGV;
# Subs 风格比较容易使用,它需要对应于标签名定义子程序
my $p = XML::Parser->new(Style => 'Subs',
        Handlers => {Char => \&text});
my $doc = $p->parsefile($file) 
            or die "cannot read file.xml\n";
say '$doc is a ', $doc;

my $f2 = $file .'.txt';
# 写入文件
open(my $fw, '>:encoding(UTF-8)', $f2) or die "cannot open file '$f2' $!";
my @array;
# 访问 hash
sub node { 
    my ($self, $tag, %attribs) = @_;
    push @array, $attribs{'TEXT'};
}
sub node_ {
    my ($self, $tag) = @_;
}
sub text {
    my ($self, $text) = @_;
}
my $ln =0; # 行数
foreach my $txt (@array){
    print $fw $txt ."\n";
    $ln++;
}
close($fw);
print $ln;

运行 perl xml_parser_subs.pl your_test.mm

参阅:XML::Parser - A perl module for parsing XML documents - metacpan.org

相关推荐
鸽芷咕12 小时前
KingbaseES数据类型完全指南:从基础CHAR到JSON/XML/几何类型
xml·oracle·json
AI人工智能+电脑小能手1 天前
【大白话说Java面试题】【Java基础篇】第19题:HashMap的key如何减少发生哈希冲突
java·开发语言·后端·面试·哈希算法·hash-index·hash
AI人工智能+电脑小能手1 天前
【大白话说Java面试题】【Java基础篇】第18题:HashMap底层是如何扩容的
java·开发语言·面试·散列表·hash-index·hash
深念Y2 天前
哈希与向量:计算机理解现实的两座桥梁
人工智能·数学·机器学习·向量·hash·哈希·空间
java1234_小锋4 天前
MyBatis中XML映射有哪些标签?
xml·tomcat·mybatis
大腕先生4 天前
通用分页超详细介绍(附带源代码解析&页面展示效果)
xml·java·linux·服务器·开发语言·前端·idea
AI人工智能+电脑小能手6 天前
【大白话说Java面试题】【Java基础篇】第7题:HashMap的get流程是什么
java·后端·面试·哈希算法·散列表·hash-index·hash
许彰午7 天前
Spring Boot + Vue 实现 XML 动态表单:固定字段 + 自由扩展方案
xml·vue.js·spring boot
AI人工智能+电脑小能手7 天前
【大白话说Java面试题】【Java基础篇】第5题:HashMap的底层原理是什么
java·开发语言·数据结构·后端·面试·hash-index·hash
untE EADO8 天前
Tomcat的server.xml配置详解
xml·java·tomcat