
正文共: 1601字 2图
预计阅读时间: 5分钟
PDF批量转Markdown工具
传送门:pdf.geo1688.com
说明:以下文章由CODEX生成,写完程序顺道儿让它整了这篇内容
这次我没有一上来就想做什么"大产品",而是从一个很小、很真实的需求开始。
群里有个朋友想找一个PDF批量转Markdown工具,要求不复杂,能批量处理就行,最好还能顺手支持PDF批量转Word。我当时正好有点空,就想:那不如直接让 Codex 试试,看能不能快速搭一个出来。
结果很有意思。
初版真的几分钟就跑起来了。

一开始的逻辑非常朴素:扫描文件夹里的 PDF,逐个转换,输出同名的.md文件。后来我又把 Word 输出也补上了,让它能把 Markdown 再转成.docx。这样一来,这个工具就不只是"能转",而是能适配两类人:
一类人要的是结构化文本,方便进知识库、做笔记、做二次处理。
另一类人要的是 Word,方便审阅、修改、流转。
所以我后来慢慢意识到,这个东西的价值,其实不只是"PDF 转文件",而是把原始资料变成可继续使用的内容。对很多人来说,这一步才是真正耗时间的。
我在做的时候,也顺手想到了一个更大的问题:AI 工具到底怎么落地?
我越来越觉得,AI 工具真正有用的地方,不是在"会不会说话",而是在具体场景里能不能替人省掉一大段重复劳动。
比如这个 PDF 工具,本质上就是在帮人把一堆杂乱的文档,变成更适合处理的结构化内容。它非常适合这些场景:
-
AI知识库整理
-
RAG 资料预处理
-
研报、招股书、课程资料归档
-
企业制度、合同、说明书整理
-
内容创作者的资料二次加工
说白了,AI 不是拿来炫的,是拿来嵌进流程里的。
你给它一个垂直场景,它就能变成一个很实用的生产力工具。
所以我后面做优化的时候,思路也很明确:
界面要更像工具,操作要更顺手,进度要看得见,使用说明要有,联系作者要有,授权也要能跑通。于是我把它继续打磨成了一个Windows 本地桌面版,先把稳定性做实。
我也试过把它往网页版本上推。
但很快就发现,网页这条路没那么轻松。带宽、资源体积、部署复杂度、浏览器兼容性,都会把体验拖住。尤其是对一个本来就要批量处理文档的工具来说,最后我还是觉得:本地桌面版更稳,也更适合这类需求。
后来我又顺手做了一个轻量的导流站,专门做 SEO 和 GEO 内容。
我的理解是,AI 时代的内容分发,不只是写给人看,也要尽量让搜索引擎和生成式引擎看得懂。
所以我做了关键词入口、产品介绍、使用场景、联系方式,目标很明确:让真正需要的人,能更快找到它。
这件事做到现在,我最大的感受其实就一句话:
AI 工具的价值,不在于覆盖所有场景,而在于把一个垂直场景做透。
像这次的 PDF批量转Markdown工具,本质上就是一个很典型的垂直应用:
输入是 PDF,输出是 Markdown 或 Word,中间解决的是"文档整理和再利用"的问题。它不需要一上来就做成全能怪兽,也不用急着追求 OCR、图片识别、复杂版式复刻。先把能落地的部分做好,就已经很有价值了。
我现在反而越来越相信一件事:
未来很多真正有用的 AI 产品,不一定是最聪明的那个,而是最懂某个具体场景的那个。
这也是我接下来还想继续做的方向。
不是去追那些很虚的概念,而是继续盯住真实需求,把 AI 真正放进工作流里,放进资料处理、文档整理、知识库建设这些垂直场景里,让它一点一点变得好用、耐用、能交付。
如果你也经常被 PDF、Word、资料整理这些东西折腾,或者你也在琢磨 AI 工具到底怎么落地,那我建议你别先想太大。
先从一个小需求开始,先做一个能用的版本。很多时候,产品就是这么长出来的。
我是数字游民9527,一个沉迷于AI世界的普通人。
我在努力践行「把自己产品化」的理念,通过「Build in public & Learn in Public」的方式尝试建立个人品牌。
我希望通过直接下场行动的方式,验证普通人如何通过AI实现商业化实践,追求个体的财富与幸福。
我的互联网简历:🔍数字游民9527
期待与更多同频伙伴一同前行。