使用python脚本爬取前端页面上的表格导出为Excel

前几天有前端小伙伴说后端没写导出功能,但是现在人事需要用到这个表,要导出Excel给她,那就用脚本爬一下吧,30行代码搞定。


电脑需要有python3环境,用解释器打开,没包的下载包,然后跑一下就行,需要注意的是,直接用的find('table') ,如果有多个table,想要爬某个表格,那就指定id去查。下课。

python 复制代码
import requests
from bs4 import BeautifulSoup
import pandas as pd

#   获取网页内容
url = "http://127.0.0.1:53893/"
response = requests.get(url)
html_content = response.text

#  解析html 获取表格 提取表头
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find('table')

headers = []
for th in table.find_all('th'):
    headers.append(th.text.strip())

#  提取表格的行数据
rows = []
for tr in table.find_all('tr')[1:]:  # 从第二行开始,第一行是表头
    cells = tr.find_all('td')
    row = [cell.text.strip() for cell in cells]
    if row:
        rows.append(row)

df = pd.DataFrame(rows, columns=headers)

#  导出为Excel
df.to_excel('index.xlsx', index=False)

print("数据已成功导出到index.xlsx")
相关推荐
夏之小星星2 分钟前
el-tree结合checkbox实现数据回显
前端·javascript·vue.js
crazyme_616 分钟前
前端自学入门:HTML 基础详解与学习路线指引
前端·学习·html
勘察加熊人24 分钟前
Python+Streamlit实现登录页
开发语言·python
撸猫79124 分钟前
HttpSession 的运行原理
前端·后端·cookie·httpsession
DavieLau28 分钟前
Python开发后端InfluxDB数据库测试接口
服务器·数据库·python·时序数据库
亦世凡华、43 分钟前
Rollup入门与进阶:为现代Web应用构建超小的打包文件
前端·经验分享·rollup·配置项目·前端分享
文人sec1 小时前
接口自动化测试设计思路--设计实战
python·https·单元测试·自动化·pytest
琉璃℡初雪1 小时前
vue2/3 中使用 @vue-office/docx 在网页中预览(docx、excel、pdf)文件
vue.js·pdf·excel
Bl_a_ck1 小时前
【React】Craco 简介
开发语言·前端·react.js·typescript·前端框架
子燕若水1 小时前
Flask 调试的时候进入main函数两次
后端·python·flask