Python 使用 openpyxl 从 URL 读取 Excel 并获取 Sheet 及单元格样式信息

摘要

本文介绍了基于openpyxl库实现从URL读取Excel文件并提取单元格内容和样式信息的方法。主要实现了两个功能:1)获取指定Sheet指定区域的单元格值及样式(如字体大小、颜色、背景色等);2)获取Excel中所有Sheet名称列表。文章详细说明了核心思路、完整代码实现及测试示例,并总结了注意事项和适用场景。该方法无需将Excel保存到本地,适合微服务和接口调用场景,可用于报表解析、在线预览、样式还原等多种业务需求。

一、背景说明

在实际业务中,我们经常会遇到这样的需求:

  • Excel 文件不在本地,而是通过 HTTP URL 提供

  • 需要读取 Excel 中指定 Sheet

  • 不仅要读取单元格的值,还要获取:

    • 字体大小
    • 字体颜色
    • 背景色
    • 主题色
    • 字体名称等样式信息
  • 同时支持获取 所有 Sheet 名称列表

本文基于 openpyxl,实现了两个实用函数:

  1. 根据 URL + Sheet 名称 + 单元格范围,读取单元格内容和样式
  2. 根据 URL,获取 Excel 中所有 Sheet 名称

二、环境准备

1. Python 版本

bash 复制代码
Python 3.7+

2. 安装依赖

bash 复制代码
pip install openpyxl

三、核心思路

1️⃣ 从 URL 读取 Excel 文件

Excel 并不需要先保存到磁盘,可以直接通过 urllib.request.urlopen 读取二进制内容,再用 io.BytesIO 转为内存文件:

python 复制代码
file = urllib.request.urlopen(direct_link).read()
wb = load_workbook(filename=io.BytesIO(file))

2️⃣ 获取 Sheet

python 复制代码
sheet = wb[sheet_name]

3️⃣ 按区域读取单元格

openpyxl 支持类似 A2:A5A1:C10 这种 Excel 区域写法:

python 复制代码
cell_3 = sheet[sheet_info]

遍历时需要 双重循环(行 + 列)

python 复制代码
for row in cell_3:
    for column in row:
        ...

四、完整代码实现

1️⃣ 获取指定 Sheet 指定区域的单元格信息

python 复制代码
from openpyxl import load_workbook
import io
import urllib.request

def get_sheet_info(direct_link, sheet_name, sheet_info):
    me = []
    res = {}
    try:
        # 从 URL 读取 Excel 文件
        file = urllib.request.urlopen(direct_link).read()
        wb = load_workbook(filename=io.BytesIO(file))

        # 根据 sheet 名称获取 sheet
        sheet = wb[sheet_name]

        # 获取指定区域
        cell_3 = sheet[sheet_info]

        for row in cell_3:
            for column in row:
                js = {}
                js['row'] = column.coordinate
                js['value'] = str(column.value)
                js['font_sz'] = column.font.sz

                # 字体主题色
                if isinstance(column.font.color.theme, int):
                    js['font_theme'] = column.font.color.theme
                else:
                    js['font_theme'] = -1

                # 垂直对齐方式
                if column.font.vertAlign is None:
                    js['vertAlign'] = "None"
                else:
                    js['vertAlign'] = column.font.vertAlign

                # 字体 RGB 颜色
                if isinstance(column.font.color.rgb, str):
                    js['font_color'] = column.font.color.rgb
                else:
                    js['font_color'] = ""

                # 背景 RGB 颜色
                if isinstance(column.fill.start_color.rgb, str):
                    js['back_color'] = column.fill.start_color.rgb
                else:
                    js['back_color'] = ""

                # 字体名称
                js['name'] = column.font.name

                # 背景主题色
                if isinstance(column.fill.fgColor.theme, int):
                    js['back_theme'] = column.fill.fgColor.theme
                else:
                    js['back_theme'] = -1

                me.append(js)

        res['code'] = "500"
        res['msg'] = "未获取excel信息"
        res['data'] = me
        return res

    except Exception:
        res['code'] = "400"
        res['msg'] = "url获取失败"
        return res

2️⃣ 获取 Excel 中的所有 Sheet 名称

python 复制代码
def get_sheet_list(direct_link):
    res = {}
    try:
        file = urllib.request.urlopen(direct_link).read()
        wb = load_workbook(filename=io.BytesIO(file))

        res['code'] = 200
        res['msg'] = "获取成功"
        res['data'] = wb.sheetnames

    except Exception:
        res['code'] = "400"
        res['msg'] = "url获取失败"

    return res

五、测试示例

python 复制代码
a = get_sheet_info(
    "http://192.168.31.161:8080/555.xlsx",
    "采购合理性数据分析(答案)",
    "A2:A5"
)
print(a)

b = get_sheet_list("http://192.168.31.161:8080/555.xlsx")
print(b)

六、运行结果示例

1️⃣ 单元格信息返回结果

json 复制代码
{
  "code": "500",
  "msg": "未获取excel信息",
  "data": [
    {
      "row": "A2",
      "value": "季度",
      "font_sz": 11.0,
      "font_theme": 1,
      "vertAlign": "None",
      "font_color": "",
      "back_color": "00000000",
      "name": "宋体",
      "back_theme": -1
    },
    {
      "row": "A3",
      "value": "2018-1",
      "font_sz": 11.0,
      "font_theme": 1,
      "vertAlign": "None",
      "font_color": "",
      "back_color": "00000000",
      "name": "宋体",
      "back_theme": -1
    }
  ]
}

2️⃣ Sheet 列表返回结果

json 复制代码
{
  "code": 200,
  "msg": "获取成功",
  "data": [
    "供应商信息表",
    "采购中标信息表",
    "订单信息表",
    "采购合理性数据分析(答案)"
  ]
}

七、注意事项与坑点总结

  1. theme / rgb 可能为空

    • 必须先判断类型,否则会报错
  2. 区域遍历是二维结构

    • sheet["A2:A5"] 返回的是「行数组」
  3. Excel 不落盘,适合微服务 / 接口调用

  4. 异常建议细化

    • 实际生产可区分网络异常、Sheet 不存在、区域错误等

八、适用场景

  • 报表解析服务
  • Excel 在线预览
  • 样式还原
  • BI / 数据分析前置处理
  • 后端接口返回 Excel 元信息
相关推荐
毕设源码-钟学长2 小时前
【开题答辩全过程】以 基于Python的健康食谱规划系统的设计与实现为例,包含答辩的问题和答案
开发语言·python
wtsolutions3 小时前
MCP Server Integration - JSON to Excel for AI and Automation
json·excel
百***78753 小时前
Grok-4.1技术深度解析:双版本架构突破与Python API快速集成指南
大数据·python·架构
2501_942191774 小时前
基于YOLO11-HSFPN的数字检测与识别模型实现详解
python
开开心心就好4 小时前
音频编辑工具,多端支持基础剪辑易操作
java·网络·windows·java-ee·电脑·maven·excel
忧郁的橙子.4 小时前
26期_01_Pyhton基本语法
python
sunfove5 小时前
实战篇:用 Python 徒手实现模拟退火算法解决 TSP 问题
开发语言·python·模拟退火算法
我是菜鸟0713号5 小时前
Qt + Python 算法集成的一种低耦合实践:FastAPI 服务化方案
python·qt·fastapi
我是一只小青蛙8885 小时前
TraeCNIDE Python开发全流程指南
python