免费的大批量Excel文档大模型处理数据工具

我们提出了一种可以利用大模型批量对Excel条目做分类、汇总等操作的工具。工具地址:

基于大模型批量分析Excel文件

使用效果如下图所示:


工具使用说明

📋 目录


📖 简介

FileProcess 是一个基于大语言模型(LLM)的 Excel 文件批量处理工具。它可以帮助您:

  • ✅ 批量对 Excel 数据进行智能分类
  • ✅ 自动提取文本关键词
  • ✅ 生成文本摘要
  • ✅ 支持多工作表(Sheet)处理
  • ✅ 实时查看处理进度
  • ✅ 导出处理结果

🚀 快速开始

第一步:上传文件

  1. 准备 Excel 文件

    • 支持格式:.xlsx.xls
    • 确保文件第一行为表头(列名)
    • 支持多工作表(Sheet)
  2. 上传方式

    • 方式一:拖拽文件到上传区域

    • 方式二:点击上传区域选择文件

      ┌─────────────────────────────┐
      │ 📤 文件上传区域 │
      │ │
      │ 将Excel文件拖到此处,或 │
      │ 点击上传 │
      │ │
      │ 支持 .xlsx 和 .xls 格式 │
      └─────────────────────────────┘

第二步:预览数据

上传成功后,系统会自动解析文件并显示数据预览:

  • 📊 多工作表支持:如果文件包含多个 Sheet,会以标签页形式显示

  • 行选择:点击表格左侧复选框选择要处理的数据行

  • 🔍 全选/清空:使用工具栏按钮快速选择或清空

    ┌─────────────────────────────────────┐
    │ 数据预览 [全选] [清空] │
    ├─────────────────────────────────────┤
    │ Sheet1 │ Sheet2 │ Sheet3 │
    ├─────────────────────────────────────┤
    │ ☑ 列1 │ 列2 │ 列3 │ 列4 │
    │ ☐ 数据1 │ 数据2 │ 数据3 │ 数据4 │
    │ ☐ 数据1 │ 数据2 │ 数据3 │ 数据4 │
    └─────────────────────────────────────┘

第三步:配置处理参数

在右侧配置面板中设置处理参数:

1. 选择大模型
复制代码
┌─────────────────────────┐
│ 🧠 模型选择              │
├─────────────────────────┤
│ 选择大模型: [下拉选择]   │
│                         │
│ 已选择: GPT-4           │
└─────────────────────────┘
  • 点击下拉框选择要使用的 LLM 模型
  • 模型标签说明:
    • 🟡 Reasoning:支持推理的模型
    • 🔵 Vision:支持多模态(图像)的模型
2. 选择功能类型
复制代码
┌─────────────────────────┐
│ 📌 功能类型              │
├─────────────────────────┤
│ (●) 分类  ( ) 关键词    │
│ ( ) 摘要                │
└─────────────────────────┘
  • 分类:将数据分类到指定类别
  • 关键词:提取文本中的关键词(当前版本暂不可用)
  • 摘要:生成文本摘要
3. 配置分类设置(以分类功能为例)
方式一:使用模板
复制代码
┌─────────────────────────┐
│ 📁 选择模板              │
├─────────────────────────┤
│ 模板: [下拉选择]         │
│                         │
│ [保存为模板] [我的模板] │
└─────────────────────────┘
  • 从下拉列表选择预设的分类模板
  • 模板会显示:名称、类型(系统/用户)、类别数量
  • 点击"我的模板"查看和管理自定义模板
方式二:自定义类别
复制代码
┌─────────────────────────┐
│ 🏷️ 自定义类别名称        │
├─────────────────────────┤
│ [类别1] [类别2] [类别3]  │
│                         │
│ 输入类别名称后按Enter    │
│ 已添加 3 个类别          │
└─────────────────────────┘
  • 在输入框中输入类别名称,按 Enter 键添加
  • 最多可添加 20 个类别
  • 至少需要 2 个类别才能开始处理
分类提示词(可选)
复制代码
┌─────────────────────────┐
│ ✏️ 分类提示词            │
├─────────────────────────┤
│ [文本输入框]             │
│                         │
│ 留空将使用默认提示词     │
└─────────────────────────┘
  • 自定义分类提示词,指导模型如何进行分类
  • 留空则使用系统默认提示词
4. 选择处理列
复制代码
┌─────────────────────────┐
│ 📋 选择列                │
├─────────────────────────┤
│ [多选下拉框]             │
│                         │
│ 选择要处理的列(可多选) │
└─────────────────────────┘
  • 选择要发送给 LLM 处理的列
  • 支持多选
  • 如果不选择,将处理整行数据
5. 系统提示词(可选)
复制代码
┌─────────────────────────┐
│ ⚙️ 系统提示词            │
├─────────────────────────┤
│ [文本输入框]             │
│                         │
│ 定义模型的角色和行为      │
└─────────────────────────┘
  • 设置系统级别的提示词
  • 用于定义模型的角色和整体行为

第四步:开始处理

配置完成后,点击 "开始处理" 按钮:

复制代码
┌─────────────────────────┐
│ [🚀 开始处理]            │
│                         │
│ 处理中时显示:           │
│ [⏳ 处理中...]          │
│ [👁️ 查看进度]           │
└─────────────────────────┘

🔍 功能详解

1. 数据预览功能

多工作表切换

如果 Excel 文件包含多个工作表,会在顶部显示标签页:

复制代码
Sheet1 | Sheet2 | Sheet3
  ↑
当前选中的工作表
行选择操作
  • 单选:点击行首复选框
  • 全选:点击工具栏"全选"按钮
  • 清空:点击工具栏"清空"按钮
  • 跨工作表选择:可以在不同工作表中选择不同的行

2. 处理进度监控

点击"查看进度"或开始处理后,会弹出进度对话框:

复制代码
┌─────────────────────────────────────┐
│ Processing                           │
├─────────────────────────────────────┤
│ 进度: ████████░░ 80% (40/50)        │
│                                     │
│ 统计信息:                            │
│ • 总行数: 50                         │
│ • 已处理: 40                         │
│ • 平均耗时: 2.5秒/行                 │
│ • 预计剩余: 25秒                      │
│                                     │
│ 实时结果表格:                        │
│ [显示已处理的数据和结果]              │
│                                     │
│ [停止] [继续处理] [导出到 XLSX]      │
└─────────────────────────────────────┘
进度信息说明
  • 进度条:显示处理百分比
  • 总行数:需要处理的总行数
  • 已处理:已完成处理的行数
  • 平均耗时:每行平均处理时间
  • 预计剩余:预计完成剩余任务所需时间
操作按钮
  • 停止:暂停当前处理任务
  • 继续处理:恢复暂停的任务
  • 导出到 XLSX:将处理结果导出为 Excel 文件

3. 模板管理

保存为模板

当您配置好分类类别后,可以保存为模板以便下次使用:

  1. 配置好类别名称(至少 2 个)
  2. 点击"保存为模板"按钮
  3. 填写模板信息:
    • 模板名称:必填
    • 模板描述:可选
    • 是否公开:选择是否公开给其他用户使用
  4. 点击确认保存
我的模板
  • 查看所有自定义模板

  • 显示模板使用次数

  • 可以应用或删除模板

    ┌─────────────────────────────────────┐
    │ 我的模板 │
    ├─────────────────────────────────────┤
    │ 名称 │ 类别列表 │ 使用 │ 操作 │
    ├─────────────────────────────────────┤
    │ 情感分析 │ 正面 负面 │ 15 │应用│删除│
    │ 产品分类 │ A B C D │ 8 │应用│删除│
    └─────────────────────────────────────┘

4. 结果导出

处理完成后,可以导出结果:

  1. 在进度对话框中点击"导出到 XLSX"
  2. 系统会生成包含以下内容的 Excel 文件:
    • 原始数据列
    • 处理结果列(分类结果/关键词/摘要)
    • 保持原有的工作表结构

📝 使用流程

完整流程示例

复制代码
┌─────────────────────────────────────────┐
│  1. 上传 Excel 文件                      │
│     ↓                                    │
│  2. 预览数据,选择要处理的行              │
│     ↓                                    │
│  3. 选择 LLM 模型                       │
│     ↓                                    │
│  4. 选择功能类型(分类/关键词/摘要)     │
│     ↓                                    │
│  5. 配置分类设置(类别/模板/提示词)      │
│     ↓                                    │
│  6. 选择要处理的列(可选)               │
│     ↓                                    │
│  7. 设置系统提示词(可选)               │
│     ↓                                    │
│  8. 点击"开始处理"                       │
│     ↓                                    │
│  9. 查看处理进度                        │
│     ↓                                    │
│  10. 导出结果到 Excel                    │
└─────────────────────────────────────────┘

分类任务示例

场景:对客户反馈进行情感分类

  1. 准备数据:Excel 文件包含"客户反馈"列

  2. 选择模型:GPT-4

  3. 功能类型:选择"分类"

  4. 配置类别

    • 正面
    • 负面
    • 中性
  5. 选择列:选择"客户反馈"列

  6. 分类提示词 (可选):

    复制代码
    请根据客户反馈的内容,判断其情感倾向。
    如果反馈是赞扬、满意的,归类为"正面";
    如果反馈是抱怨、不满的,归类为"负面";
    如果反馈是中性的,归类为"中性"。
  7. 开始处理:点击按钮开始批量处理

  8. 导出结果:处理完成后导出包含分类结果的 Excel 文件

摘要任务示例

场景:为产品描述生成简短摘要

  1. 准备数据:Excel 文件包含"产品描述"列

  2. 选择模型:GPT-4

  3. 功能类型:选择"摘要"

  4. 摘要提示词

    复制代码
    请将以下产品描述总结为一句话,突出产品的主要特点和优势。
  5. 选择列:选择"产品描述"列

  6. 开始处理:批量生成摘要

  7. 导出结果:导出包含摘要的 Excel 文件


❓ 常见问题

Q1: 支持哪些文件格式?

A : 目前支持 .xlsx.xls 格式的 Excel 文件。

Q2: 可以处理多大的文件?

A: 理论上没有严格限制,但建议:

  • 单次处理行数不超过 1000 行
  • 文件大小不超过 10MB
  • 如果数据量大,可以分批处理

Q3: 处理速度如何?

A: 处理速度取决于:

  • 选择的 LLM 模型(不同模型速度不同)
  • 数据行的长度和复杂度
  • 网络连接状况

通常每行处理时间在 20-50 秒之间。

Q4: 可以中途停止处理吗?

A: 可以。点击"停止"按钮可以暂停处理,之后可以点击"继续处理"恢复。

Q5: 处理失败怎么办?

A:

  • 系统会自动重试失败的请求(最多 3 次)
  • 如果某行处理失败,会在结果中标记
  • 可以重新选择失败的行再次处理

Q6: 如何保存常用配置?

A:

  • 对于分类任务,可以保存为模板
  • 模板会保存类别名称和提示词
  • 下次使用时直接选择模板即可

Q7: 可以处理多个工作表吗?

A: 可以。系统支持多工作表,您可以在不同工作表中选择不同的行进行处理。

Q8: 选择列的作用是什么?

A:

  • 如果选择特定列,只有这些列的数据会被发送给 LLM
  • 如果不选择列,整行数据都会被发送
  • 建议只选择需要处理的列,可以提高效率和准确性

💡 最佳实践

1. 数据准备

推荐做法

  • 确保第一行是表头(列名)
  • 数据格式规范,避免空行
  • 需要处理的文本列内容完整

避免

  • 表头和数据混在一起
  • 大量空值或格式不一致的数据

2. 类别设计

推荐做法

  • 类别名称清晰明确,避免歧义
  • 类别之间互斥且覆盖全面
  • 类别数量适中(建议 2-10 个)

避免

  • 类别名称模糊(如"其他"、"杂项")
  • 类别之间有重叠
  • 类别过多(超过 15 个)

3. 提示词编写

推荐做法

  • 明确说明分类标准
  • 给出每个类别的判断依据
  • 提供示例(如果可能)

示例

复制代码
请根据产品评论的内容进行分类:
- "好评":包含赞扬、推荐、满意等正面词汇
- "差评":包含抱怨、不满、退货等负面词汇
- "中性":既不正面也不负面,或信息不足

4. 批量处理策略

推荐做法

  • 先处理少量数据(10-20 行)测试效果
  • 确认结果符合预期后再批量处理
  • 对于大量数据,分批处理(每次 100-200 行)

5. 模型选择

推荐做法

  • 简单分类任务:选择速度快的模型
  • 复杂任务:选择推理能力强的模型(带 Reasoning 标签)
  • 需要理解图像:选择多模态模型(带 Vision 标签)

6. 结果验证

推荐做法

  • 处理完成后,抽样检查结果准确性
  • 对于错误分类,分析原因并优化提示词
  • 保存有效的配置为模板

🎯 使用技巧

技巧 1: 利用模板提高效率

如果您经常需要执行相同的分类任务,建议:

  1. 第一次使用时,仔细配置类别和提示词
  2. 测试确认效果后,保存为模板
  3. 后续直接使用模板,无需重复配置

技巧 2: 优化提示词

好的提示词可以显著提高分类准确性:

  • 具体化:明确每个类别的判断标准
  • 示例化:提供典型示例
  • 结构化:使用列表或表格格式

技巧 3: 分步处理

对于大量数据:

  1. 先处理一小部分(如 50 行)
  2. 检查结果质量
  3. 根据结果调整配置
  4. 再批量处理剩余数据

技巧 4: 列选择策略

  • 只选择相关列:只选择包含需要分析信息的列
  • 避免冗余:不要选择无关的列(如 ID、日期等)
  • 组合使用:可以将多个相关列一起选择

📞 获取帮助

如果您在使用过程中遇到问题:

  1. 查看本文档:首先查阅本文档的常见问题部分
  2. 检查配置:确认所有必填项都已正确配置
  3. 查看日志:打开浏览器控制台查看详细错误信息
  4. 联系支持:如问题仍未解决,请联系技术支持

📌 注意事项

⚠️ 重要提示

  1. 数据隐私:处理的数据会发送到 LLM 服务,请注意数据敏感性
  2. 网络连接:确保网络连接稳定,避免处理中断
  3. 浏览器兼容:建议使用 Chrome、Edge 等现代浏览器
  4. 登录状态:使用前请确保已登录系统
  5. 无配额限制:免费使用

相关推荐
xwz小王子4 小时前
IROS 2025论文分享:基于大语言模型与行为树的人机交互学习实现自适应机器人操作
学习·语言模型·人机交互
Eiceblue5 小时前
使用 Python 写入多类型数据至 Excel 文件
开发语言·python·excel
阿杰学AI6 小时前
AI核心知识65——大语言模型之Vibe Coding (简洁且通俗易懂版)
人工智能·ai·语言模型·aigc·ai编程·vibe coding·ai coding
阿杰学AI6 小时前
AI核心知识64——大语言模型之RLVR (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·rlvr·基于可验证奖励的强化学习
蹦蹦跳跳垂耳兔6 小时前
Excel创建组妙用隐藏
excel
小女孩真可爱7 小时前
大模型学习记录(九)-------Agent
人工智能·pytorch·深度学习·学习·大模型
开开心心_Every8 小时前
无广告干扰:简单好用文字LOGO设计工具
xml·java·网络·数据库·华为od·华为云·excel
CoderJia程序员甲9 小时前
GitHub 热榜项目 - 日榜(2025-12-23)
ai·开源·大模型·github·ai教程
java1234_小锋9 小时前
Transformer 大语言模型(LLM)基石 - 输出层(Output Layer)详解以及算法实现
深度学习·语言模型·transformer