正则表达式和excel文件保存(python)

正则表达式

import re

data = """

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8" />

    <title>测试页面</title>

</head>

<body>

<h1>《人工智能的发展趋势分析报告》</h1>

<ul id='list1'>

<li class="msg" title="1111">红豆生南国,春来发几枝</li>

<li class="msg" title="2222">红豆生南国,春来发几枝</li>

<li class="msg" title="3333">红豆生南国,春来发几枝</li>

<li class="msg" title="4444">红豆生南国,春来发几枝</li>

</ul>

<ul>

<li>1</li>

<li>2</li>

<li>3</li>

<li>4</li>

</ul>

</body>

</html>

"""

#re.DOTALL 用.这个符号代替所有的字符

#re.VERBOSE 正则表达式 多行

ret = re.findall(r"""

<ul.+?'list1'.+?title="2222">(.+?)</li>

""",data,flags=re.DOTALL|re.VERBOSE)

print(ret)

excel文件保存

import xlwt # 导入excel模块

list = [

"姓名", "年龄", "分数",

"张三", 20, 100,

"李四", 20, 100,

"王五", 20, 100

]

# 工作簿--->工作表--->单元格

1.创建工作簿

workbook = xlwt.Workbook()

2.在工作簿里面添加工作表

sheet = workbook.add_sheet("成绩单")

3.在工作表中添加单元格

for row in range(len(list)): # 0,1,2,3

for col,value in enumerate(listrow):

print(row, col, value)

sheet.write(row, col, value)

4.保存工作簿

workbook.save("成绩.xlsx")

相关推荐
这个DBA有点耶8 小时前
NULL不是空——数据库里最反直觉的设计,90%新人踩过的坑
数据库·mysql·代码规范
用户8356290780518 小时前
Python 实现 PDF 文件加密与解密方法
后端·python
用户8356290780518 小时前
使用 Python 冻结与拆分 Excel 窗格教程
后端·python
你好潘先生16 小时前
别再记命令了,用 yeero do 说句人话就能跑脚本,而且不烧 token
服务器·python·命令行
Agent_大师17 小时前
WebSocket 行情重连成功,K线缺口不会自动消失
python
荣码17 小时前
LLM结构化输出:让AI返回JSON而不是废话,我踩了4个坑
java·python
copyer_xyf17 小时前
FastAPI 如何连接 MySQL
后端·python
apocelipes1 天前
常用编程语言和库的正则表达式性能对比
c语言·c++·python·性能优化·golang·开发工具和环境
用户8356290780511 天前
使用 Python 在 PDF 中创建与管理书签
后端·python
这个DBA有点耶1 天前
SQL改写进阶:标量子查询的“隐形代价”与消除实战
数据库·mysql·架构