R 语言学习教程,从入门到精通,R XML 文件使用(19)

1、R XML 文件

XML 指的是可扩展标记语言(eXtensible Markup Language),XML 被设计用来传输和存储数据。

R 语言读写 XML 文件需要安装扩展包,我们可以在 R 到控制台输入以下命令来安装:

r 复制代码
install.packages("XML", repos = "https://mirrors.ustc.edu.cn/CRAN/")

查看是否安装成功:

r 复制代码
> any(grepl("XML",installed.packages()))
[1] TRUE

创建 sites.xml 文件,xml 文件与测试脚本同一目录下,代码如下:

r 复制代码
<sites>
    <site>
        <id>1</id>
        <name>Google</name>
        <url>www.google.com</url>
        <likes>111</likes>
    </site>
 
    <site>
        <id>2</id>
        <name>Nhooo</name>
        <url>www.cainiaojc.com</url>
        <likes>222</likes>
    </site>
 
    <site>
        <id>3</id>
        <name>Taobao</name>
        <url>www.taobao.com</url>
        <likes>333</likes>
    </site>
</sites>

接下来我们可以使用 XML 包来载入 xml 文件的数据:

r 复制代码
# 载入 XML 包
library("XML")

# 设置文件名
result <- xmlParse(file = "sites.xml")
# 输出结果
print(result)

统计 xml 数据量:

r 复制代码
# 载入 XML 包
library("XML")

# 设置文件名
result <- xmlParse(file = "sites.xml")
# 提取根节点
rootnode <- xmlRoot(result)
# 统计数据量
rootsize <- xmlSize(rootnode)
# 输出结果
print(rootsize)

执行以上代码输出结果为:

r 复制代码
[1] 3

查看节点数据,某一行使用 [ ], 指定的行和列使用 [[ ]]:

r 复制代码
# 载入 XML 包
library("XML")
# 设置文件名
result <- xmlParse(file = "sites.xml")
# 提取根节点
rootnode <- xmlRoot(result)
# 查看第 2 个节点数据
print(rootnode[2])
# 查看第 2 个节点的第  1 个数据
print(rootnode[[2]][[1]])
# 查看第 2 个节点的第 3 个数据
print(rootnode[[2]][[3]])

执行以上代码输出结果为:

r 复制代码
$site
<site>
  <id>2</id>
  <name>Nhooo</name>
  <url>www.cainiaojc.com</url>
  <likes>222</likes>
</site> 
attr(,"class")
[1] "XMLInternalNodeList" "XMLNodeList"        
<id>2</id> 
<url>www.cainiaojc.com</url>

1.1、XML 转为数据列表

以上代码对输出都是 xml 格式,我们使用 xmlToList() 函数可以将文件对数据转为列表格式,更方便读取:

r 复制代码
# 载入 XML 包
library("XML")
# xml 文件数据转为数据框
xmldataframe <- xmlToDataFrame("sites.xml")
print(xmldataframe)

执行以上代码输出结果为:

r 复制代码
 id   name            url likes
1  1 Google www.google.com   111
2  2 Nhooo www.cainiaojc.com   222
3  3 Taobao www.taobao.com   333
相关推荐
青山是哪个青山2 分钟前
C++ 核心基础与面向对象 (OOP)
开发语言·c++
求真求知的糖葫芦4 分钟前
耦合传输线分析学习笔记(六)不对称耦合微带线Z参数矩阵推导与应用
笔记·学习·矩阵·射频工程
小明同学015 分钟前
[C++进阶]深入理解二叉搜索树
开发语言·c++·git·visualstudio
C+++Python10 分钟前
C++ vector
开发语言·c++·算法
求真求知的糖葫芦11 分钟前
耦合传输线分析学习笔记(七)不对称耦合微带线Y参数矩阵推导与应用
笔记·学习·矩阵·射频工程
莫问前路漫漫12 分钟前
Python包管理工具pip完整安装教程
开发语言·python
superman超哥12 分钟前
处理复杂数据结构:Serde 在实战中的深度应用
开发语言·rust·开发工具·编程语言·rust serde·rust数据结构
_codemonster13 分钟前
手语识别及翻译项目实战系列(四)整体架构
人工智能·python·计算机视觉
Java程序员威哥14 分钟前
Arthas+IDEA实战:Java线上问题排查完整流程(Spring Boot项目落地)
java·开发语言·spring boot·python·c#·intellij-idea
2401_8414956415 分钟前
【LeetCode刷题】K 个一组翻转链表
数据结构·python·算法·leetcode·链表·翻转链表·迭代翻转