这个叫DOCX-MCP的开源项目,解决了AI操作Word的一个大麻烦

咱们日常工作,谁都躲不开Word。写个报告、做个合同、填个申请,哪哪都是它。但说句心里话,这东西一旦涉及到批量处理,就特别折磨人。

我见过太多人了,每个月花好几天,手动拿Excel里的数据,去挨个生成Word文档。那活儿,就是纯粹的"复制-粘贴",没任何技术含量,但就是耗你时间,磨你耐心。

所以,我一直在琢磨一个事:能不能让AI来干这个活儿?不是那种让你上传文件、点几下按钮的在线工具,而是能像个助理一样,你用大白话指挥它,它就能帮你把Word里的活儿给干了。

巧的是,前阵子在魔搭社区的MCP&Agent挑战赛上,还真让我碰到了一个给这个难题交出漂亮答卷的项目。这个项目叫DOCX-MCP,作者是开发者rockcj------后来他也成了我们社区的一员。

这玩意儿,就特别接近我心里想的那个"AI助理"的样子。

今天,我就想把这个项目掰开揉碎了,跟你盘盘它是怎么做到的。


01|上手之前:这玩意儿到底是个啥?


在开干之前,咱们得先弄明白,DOCX-MCP究竟是个什么东西。

说白了,它就是一个功能强大的"Word文档处理工具箱",里面塞了42个工具。但它最牛的地方在于,这个工具箱不是给你我直接用的,而是给 AI (比如DeepSeek、豆包、通义、Claude、ChatGPT等)用的。


它的核心价值,就是给 AI 和Word之间搭了座桥。

  • AI 友好: 它用的这套"MCP协议",就像是AI世界的"数据线",能让各种大模型无缝调用这些工具。
  • 功能全面: 这42个工具,把Word里从创建文档、编辑文字、处理表格到插入图片、调整页面这些常用功能,基本都给覆盖了。
  • 表格是绝活: 它对表格的处理能力特别强,能智能分析表格结构,也能实现精准的数据填充。咱们后面会细说。
  • 性能不错: 基于FastMCP框架,跑起来不墨迹,响应很快。
  • 集成方便: 因为协议是标准的,所以很容易把它接入到你自己的各种应用里去。

一句话总结:DOCX--MCP 就是一套给 AI 准备的、专门用来操作Word的工具。

说到这儿,多提一句。DOCX-MCP是rockcj兄弟给我们封装好的一个成品,即插即用,非常方便。但如果你跟我一样,是个喜欢刨根问底、自己动手"手搓"工具的开发者,那你可能就会琢磨:"我自己能不能也封装一个这样的MCP服务呢?"

问得好。就在昨天,我们刚写了一篇《手把手教你用MCP封装火山"即梦" API ,搭建一个" 即插即用 "的 AI 绘画服务》,里面就详细拆解了怎么把一个AI绘画服务,一步步封装成AI能听懂的 MCP 工具。 还有手把手带你基于官方的案例搓一个简单的MCP服务 想自己动手的,可以去翻翻看。


02|三步上手:把工具接到你的 AI


道理都懂,但用起来麻不麻烦?说实话,作者把这事儿简化到了极致。咱们就用最推荐的"懒人办法",三步把它搞定。


第一步:安装和运行(两种模式可选)


  • 模式一:本地运行

这个方法最适合尝鲜。打开你电脑的终端(Windows叫CMD或PowerShell,Mac叫终端),就敲下面这一行命令,然后回车: uvx docx-mcp

(如果你的电脑没装过uv,终端会提示你怎么装,按提示操作就行,一分钟搞定。)

当你看到终端里刷出一长串工具列表,告诉你"总计: 42个工具"时,就说明服务已经成功在你电脑上启动了。


  • 模式二:云端直接用

如果你连终端都不想打开,还有个更省事儿的办法。作者已经把这个工具部署到了魔搭社区上,你可以直接在云端配置使用,点点鼠标就行。


✅ 第二步:给 AI "引荐"新工具(以TRAE为例)


  • 把下面这段JSON加到它的服务器配置里:
json 复制代码
{
  "mcpServers": {
    "docx-mcp": {
      "command": "uvx",
      "args": [
        "docx-mcp"
      ]
    }
  }
}
  • 配置成功后,会显示绿色的对勾。

第三步:下达 指令 ,开始干活!

现在,一切就绪。你可以在TRAE里直接用自然语言来指挥它操作Word了。

注意你需要@Builder with MCP协作,这样你才可以让AI使用docx-mcp工作

比如,你可以试试下面这个指令:

使用docx-mcp工具:

  1. 创建一个名为"工作周报.docx"的新文档。
  2. 在文档里添加一个一级标题,内容是"关于本周项目进展"。
  3. 在标题下方,添加一个段落,内容是"本周项目进展顺利,各项指标均已达成。"
  4. 最后,保存文档。

把这段话发给TRAE,它就会开始调用工具来执行。

完成后,你就可以在你电脑的用户文件夹里找到这个新鲜出炉的"工作周报.docx"文件了。


03|42件"神兵利器"全解析


接下来是重头戏。这42个工具到底都是干啥的?我不会像说明书一样全列出来,而是把它们分成几类,告诉你每一类是干嘛的,重点盘几个最有用的。


第一类:基本功(文档管理工具,8个)

这部分工具,解决的是所有文件层面的操作。AI可以用create_document新建文档,用open_document打开,用save_documentsave_as_document保存,用close_document关闭,还能用copy_documentcreate_work_copy复制文件,甚至用get_document_info来先查看文档的基本信息。

  • 实战指令:

"帮我新建一个Word文档,保存为'项目周报_2025_W41.docx'。另外,把上周的'工作周报'也复制一份到这个文件夹,并重命名为'周报存档.docx'。最后,告诉我新建的这个周报里现在有多少个段落和表格。"

  • 可以看到AI正在的调用相关工具创建新的周报文档,然后复制上周周报。
  • 现在已经创建完,并告诉我新建的周报统计

第二类:文字排版(文本内容工具,5个)

这部分工具负责处理文档里的"血肉"------文字。AI可以用add_heading添加标题,用add_paragraph添加段落,还能在添加时精细控制粗体、斜体、颜色、字体等格式。search_and_replace则是批量修改文字的法宝。

  • 实战指令:

"打开'项目周报_2025_W41.docx',在顶部添加一个一级标题'AI智能体项目周报'。接着在下面写一段话:'本周项目进展顺利,各项指标均已达成。',把'进展顺利'这四个字设为红色、加粗、14号字。然后,把整篇文档里所有的'项目'都替换成'AI项目'。"

  • 可以看到AI正在调用相关工具添加标题和段落内容等。
  • 现在AI已经按我的要求进行了编辑。

第三类:表格建造(表格操作工具,6个)

这部分工具让AI具备了从无到有"盖"出一张表格的能力。它能用add_table设定行列数直接创建,用add_table_rowadd_table_column动态增减行列,用merge_table_cells合并单元格实现复杂表头,还能用format_table设置表格的整体样式。

  • 实战指令:

"在周报的文字下面,帮我直接根据这些数据创建一个带表头的表格:第一行是'任务名称,负责人,完成度',第二行是'模型调试,张三,100%',第三行是'UI设计,李四,80%'。创建好后,把表格的整体风格设置成'浅色网格'样式,并把表头那一行里的'负责人'和'完成度'两个单元格合并起来。"

  • 可以看到AI正在调用相关工具插入表格并设置样式与合并。
  • 现在AI已经根据我的数据创建并调整表格

第四类:文档洞察(表格分析工具,5个)

这部分是AI在动手前的"眼睛"。在执行复杂操作前,AI会先调用extract_document_structureextract_all_tables_structure等工具,把整个文档的结构,包括所有表格的行列、内容、合并情况都"看"一遍,做到心中有数,这样后续操作才不会出错。

  • 实战指令:

"在操作之前,你先帮我分析一下'项目周报_2025_W41.docx'这个文档,告诉我里面有几个表格,每个表格的结构是怎样的,把结果用JSON格式给我。"

  • 可以看到AI正在调用相关工具提取该文档的完整结构并输出了JSON摘要。

第六类:美化排版(图片处理与页面设置工具,共6个)

这部分工具负责文档的"颜值"。图片方面,有add_image(添加图片)、extract_images(提取图片)、resize_image(调整图片大小)。页面方面,有set_page_margins(设置页边距)、set_page_orientation(设置页面方向)、set_page_size(设置页面大小)。

  • 实战指令:

"为了让周报更好看,在文档结尾插入'公司logo.png'这张图,把它的大小调整为2英寸宽。然后把整个文档的页边距都设为1.5英寸,并且把纸张方向改为横向。"

  • 可以看到AI正在调用相关工具在文档末尾插入图片等调整。

第七类:高阶玩法(智能功能与系统状态工具,共8个)

这部分是给进阶用户和开发者准备的。智能功能方面,AI可以调用intelligent_create_document帮你从模板智能创建文档,或者调用create_intelligent_workflow_plan为你规划任务步骤。系统状态方面,get_system_statustest_connection等工具则可以帮你检查"引擎"是否正常运转。


项目资源

为了方便你上手和研究,我把相关的地址都整理在这儿了:

开源仓库地址: https://github.com/rockcj/Docx_MCP_cj (想看源码、或者给作者贡献代码的,可以去这里)

魔搭社区服务: https://www.modelscope.cn/mcp/servers/rockcj/Docx_MCP (想直接在云上配置使用的,点这个链接)


写在最后:从"用工具"到"造工具,指挥 AI "

说到底,DOCX-MCP这样的项目,最有价值的地方在于它的"务实"。它给我们展示了一个清晰的可能性:把一个传统、封闭的软件(比如Word),通过封装成标准化的"工具箱",来交给AI接管。

一个好的工具,就应该像一把好用的锤子。今天我们把这把叫DOCX-MCP的锤子从头到尾盘了一遍,从怎么安装,到42个工具分别怎么用,尤其是它最核心的坐标填充功能。我相信,只要你跟着文章上手一试,解决自己手头一两个批量生成文档的重复性工作,是完全没问题的。

但我想跟你聊得再深一点。学会使用这样的"锤子"只是第一步,更重要的,是理解这背后工作范式的转变。过去,我们想实现类似的需求,得自己写死板的脚本;而现在,我们的角色正在从"编码者"转变为"工具打造者"和"AI指挥官"。我们负责为AI打造好用的工具(MCP),然后用自然语言去指挥AI(Agent)来完成更复杂的、动态的任务。

这个转变听起来很激动人心,但真正做起来,新的难题就来了:怎么才算一个"好"的AI工具?如何设计它的颗粒度?指挥AI的Prompt又该怎么写才能让它不出错?当AI没能正确调用工具时,我们该怎么调试?


如果本文内容对您有启发,欢迎点个【赞】、【在看】或【转发】支持一下。

感谢您的阅读,我们下次再见👋!

相关推荐
权在码代码2 小时前
CodeX CLI安装+MCP适配与VSCode部署(Win)
ide·vscode·codex·mcp·aicoding
blues_C20 小时前
Playwright MCP vs Chrome DevTools MCP vs Chrome MCP 深度对比
前端·人工智能·chrome·ai·chrome devtools·mcp·ai web自动化测试
海蓝可知天湛1 天前
Codex CLI 各类MCP支持!
mcp
mCell3 天前
MCP有了,Agents.md 又是什么?
ai编程·claude·mcp
大模型真好玩3 天前
大模型Agent开发框架哪家强?12项Agent开发框架入门与选型
人工智能·agent·mcp
魁首3 天前
MCP与ACP本质区别深度分析
claude·gemini·mcp
董厂长4 天前
SubAgent的“指令漂移 (Instruction Drift)“困境
人工智能·agent·mcp·subagent
魁首4 天前
初识 MCP (Model Context Protocol)
claude·gemini·mcp
minhuan4 天前
构建AI智能体:四十六、Codebuddy MCP 实践:用高德地图搭建旅游攻略系统
人工智能·mcp·codebuddy·高德api