Python 使用 openpyxl 从 URL 读取 Excel 并获取 Sheet 及单元格样式信息

摘要

本文介绍了基于openpyxl库实现从URL读取Excel文件并提取单元格内容和样式信息的方法。主要实现了两个功能:1)获取指定Sheet指定区域的单元格值及样式(如字体大小、颜色、背景色等);2)获取Excel中所有Sheet名称列表。文章详细说明了核心思路、完整代码实现及测试示例,并总结了注意事项和适用场景。该方法无需将Excel保存到本地,适合微服务和接口调用场景,可用于报表解析、在线预览、样式还原等多种业务需求。

一、背景说明

在实际业务中,我们经常会遇到这样的需求:

  • Excel 文件不在本地,而是通过 HTTP URL 提供

  • 需要读取 Excel 中指定 Sheet

  • 不仅要读取单元格的值,还要获取:

    • 字体大小
    • 字体颜色
    • 背景色
    • 主题色
    • 字体名称等样式信息
  • 同时支持获取 所有 Sheet 名称列表

本文基于 openpyxl,实现了两个实用函数:

  1. 根据 URL + Sheet 名称 + 单元格范围,读取单元格内容和样式
  2. 根据 URL,获取 Excel 中所有 Sheet 名称

二、环境准备

1. Python 版本

bash 复制代码
Python 3.7+

2. 安装依赖

bash 复制代码
pip install openpyxl

三、核心思路

1️⃣ 从 URL 读取 Excel 文件

Excel 并不需要先保存到磁盘,可以直接通过 urllib.request.urlopen 读取二进制内容,再用 io.BytesIO 转为内存文件:

python 复制代码
file = urllib.request.urlopen(direct_link).read()
wb = load_workbook(filename=io.BytesIO(file))

2️⃣ 获取 Sheet

python 复制代码
sheet = wb[sheet_name]

3️⃣ 按区域读取单元格

openpyxl 支持类似 A2:A5A1:C10 这种 Excel 区域写法:

python 复制代码
cell_3 = sheet[sheet_info]

遍历时需要 双重循环(行 + 列)

python 复制代码
for row in cell_3:
    for column in row:
        ...

四、完整代码实现

1️⃣ 获取指定 Sheet 指定区域的单元格信息

python 复制代码
from openpyxl import load_workbook
import io
import urllib.request

def get_sheet_info(direct_link, sheet_name, sheet_info):
    me = []
    res = {}
    try:
        # 从 URL 读取 Excel 文件
        file = urllib.request.urlopen(direct_link).read()
        wb = load_workbook(filename=io.BytesIO(file))

        # 根据 sheet 名称获取 sheet
        sheet = wb[sheet_name]

        # 获取指定区域
        cell_3 = sheet[sheet_info]

        for row in cell_3:
            for column in row:
                js = {}
                js['row'] = column.coordinate
                js['value'] = str(column.value)
                js['font_sz'] = column.font.sz

                # 字体主题色
                if isinstance(column.font.color.theme, int):
                    js['font_theme'] = column.font.color.theme
                else:
                    js['font_theme'] = -1

                # 垂直对齐方式
                if column.font.vertAlign is None:
                    js['vertAlign'] = "None"
                else:
                    js['vertAlign'] = column.font.vertAlign

                # 字体 RGB 颜色
                if isinstance(column.font.color.rgb, str):
                    js['font_color'] = column.font.color.rgb
                else:
                    js['font_color'] = ""

                # 背景 RGB 颜色
                if isinstance(column.fill.start_color.rgb, str):
                    js['back_color'] = column.fill.start_color.rgb
                else:
                    js['back_color'] = ""

                # 字体名称
                js['name'] = column.font.name

                # 背景主题色
                if isinstance(column.fill.fgColor.theme, int):
                    js['back_theme'] = column.fill.fgColor.theme
                else:
                    js['back_theme'] = -1

                me.append(js)

        res['code'] = "500"
        res['msg'] = "未获取excel信息"
        res['data'] = me
        return res

    except Exception:
        res['code'] = "400"
        res['msg'] = "url获取失败"
        return res

2️⃣ 获取 Excel 中的所有 Sheet 名称

python 复制代码
def get_sheet_list(direct_link):
    res = {}
    try:
        file = urllib.request.urlopen(direct_link).read()
        wb = load_workbook(filename=io.BytesIO(file))

        res['code'] = 200
        res['msg'] = "获取成功"
        res['data'] = wb.sheetnames

    except Exception:
        res['code'] = "400"
        res['msg'] = "url获取失败"

    return res

五、测试示例

python 复制代码
a = get_sheet_info(
    "http://192.168.31.161:8080/555.xlsx",
    "采购合理性数据分析(答案)",
    "A2:A5"
)
print(a)

b = get_sheet_list("http://192.168.31.161:8080/555.xlsx")
print(b)

六、运行结果示例

1️⃣ 单元格信息返回结果

json 复制代码
{
  "code": "500",
  "msg": "未获取excel信息",
  "data": [
    {
      "row": "A2",
      "value": "季度",
      "font_sz": 11.0,
      "font_theme": 1,
      "vertAlign": "None",
      "font_color": "",
      "back_color": "00000000",
      "name": "宋体",
      "back_theme": -1
    },
    {
      "row": "A3",
      "value": "2018-1",
      "font_sz": 11.0,
      "font_theme": 1,
      "vertAlign": "None",
      "font_color": "",
      "back_color": "00000000",
      "name": "宋体",
      "back_theme": -1
    }
  ]
}

2️⃣ Sheet 列表返回结果

json 复制代码
{
  "code": 200,
  "msg": "获取成功",
  "data": [
    "供应商信息表",
    "采购中标信息表",
    "订单信息表",
    "采购合理性数据分析(答案)"
  ]
}

七、注意事项与坑点总结

  1. theme / rgb 可能为空

    • 必须先判断类型,否则会报错
  2. 区域遍历是二维结构

    • sheet["A2:A5"] 返回的是「行数组」
  3. Excel 不落盘,适合微服务 / 接口调用

  4. 异常建议细化

    • 实际生产可区分网络异常、Sheet 不存在、区域错误等

八、适用场景

  • 报表解析服务
  • Excel 在线预览
  • 样式还原
  • BI / 数据分析前置处理
  • 后端接口返回 Excel 元信息
相关推荐
Pyeako12 小时前
深度学习--卷积神经网络(下)
人工智能·python·深度学习·卷积神经网络·数据增强·保存最优模型·数据预处理dataset
OPEN-Source12 小时前
大模型实战:搭建一张“看得懂”的大模型应用可观测看板
人工智能·python·langchain·rag·deepseek
廖圣平12 小时前
从零开始,福袋直播间脚本研究【七】《添加分组和比特浏览器》
python
B站_计算机毕业设计之家12 小时前
豆瓣电影数据可视化分析系统 | Python Flask框架 requests Echarts 大数据 人工智能 毕业设计源码(建议收藏)✅
大数据·python·机器学习·数据挖掘·flask·毕业设计·echarts
mr_LuoWei200913 小时前
python工具:python代码知识库笔记
数据库·python
weixin_3954489113 小时前
cursor日志
人工智能·python·机器学习
天天爱吃肉821813 小时前
【跨界封神|周杰伦×王传福(陶晶莹主持):音乐创作与新能源NVH测试,底层逻辑竟完全同源!(新人必看入行指南)】
python·嵌入式硬件·算法·汽车
岱宗夫up13 小时前
Python 数据分析入门
开发语言·python·数据分析
码界筑梦坊13 小时前
325-基于Python的校园卡消费行为数据可视化分析系统
开发语言·python·信息可视化·django·毕业设计
asheuojj13 小时前
2026年GEO优化获客效果评估指南:如何精准衡量TOP5关
大数据·人工智能·python