作为AI产品的深度使用者,基本每天都在使用AI。AI诞生后仿佛给所有的产品打开了新世界大门。当然AI在文献阅读方面自然也不会缺席。
先来简单对比一下ChatDOC vs ChatPDF
从表格里可以看到ChatDOC与ChatPDF都是基于GPT的产品,但在功能上ChatDOC还是比ChatPDF功能强大的多
- 文件格式
在对文件格式的支持,ChatDOC支持PDF/DOC/markdown/txt/OCR/epub/website多种格式而ChatPDF只支持PDF文件。
- AI模型
ChatDOC除了默认gpt-3.5-turbo外,还可以通过付费支持gpt-4o。如果你不想使用这些,在控制台还可以配置自己的AI模型。而从ChatPDF官网能查询到的它使用的是gpt-3.5的版本,并没有发现对gpt-4o的支持说明。
- 语言支持
ChatDOC与ChatPDF官网的平台都可以发现是对多语言的支持,ChatPDF官网"全球通用!ChatPDF接受任何语言的PDF,并可以用任何语言聊天。"而ChatDOC语言下拉可以选择10几种语言,从这方面来说ChatPDF对多语言的支持能力是比ChatDOC强大的。
- 图像和表格
ChatDOC官网有说明通过OCR可以解析文件中的图像并与之对话。而ChatPDF尚无法读取PDF中的图像,包括由扫描文本组成的图像。ChatPDF读取表格中的文本,但它可能在关联正确的行和列时遇到问题。在这方面ChatDOC要强一些。
下面我们就具体来使用一下ChatDOC与ChatPDF:
ChatDOC
ChatDOC之前也有看到不少文章对它的介绍,都是比较推荐使用的,号称"最好的PDF AI Chat",这里就来测试一下。
生成文件摘要
上传一个文件,然后点击左上角工具栏中的"摘要"按钮或输出生成摘要,就可以从非常长文件中生成关键点和见解的摘要。只需几秒钟,就可以从文件中提炼出一个简明的摘要。
从多个文件中提取见解
通过上传文件夹的方式,在多个长篇的文件中进行沟通对话,提取重点和关键发现。
内容定位能力
要求AI从文件中检索详细内容。例如
在文件中"在使用 java.util.stream.Collectors 类的 toMap() 方法转为 Map 集合时,一定要注意当 value为 null 时会抛 NPE 异常"这条规范中举的例子中pairArrayList列表增加的第一个变量version1的值是多少?并指出你的依据在文件中的位置。
可以看到,这种定位能力并不是单纯的类似查找的功能,ChatDOC理解了我们的问题,并也能理解文件中的内容、代码或公式表达的意思。从而得出相应正确的回答,同时还能给出ChatDOC依据在文件中的出处。
强大的翻译能力
无论文件原始是什么语言都能进行语言的切换,用你熟悉的语言进行聊天,ChatDOC具有强大的翻译能力。
选择特定内容询问
我们可以选择特定的表格/文本/公式,要求ChatDOC用简单的术语解释它。
ChatPDF
网站主页:直接上传PDF文件。
上传后左边是文件列表,中间是上传的PDF预览图,右边会出来文件的主要内容,及参考的问题,选中后会出现功能菜单(解释、总结、改写)。
生成文件摘要
这里的总结也类似生成文件摘要的功能,我们来看看
基本和其它AI一样都能大致提取并总结文件。
ChatPDF的总结没有像copilot那样进行总结分类,看着没那么精简。
提问+定位能力
ChatPDF也能正确的理解文字、代码或公式的意思,快速定位内容及找出答案
翻译能力
这是一份《Attention Is All You Need》的英文论文
让AI提炼PDF文件中的主要内容,并与AI对话,提相应的问题。
可以看到中文问题给出来中文回答,这些AI产品基本都带有强大的翻译能力。
上图是Leaderboard显示的ChatPDF每天的访问量。
总体来说还是不错的,从功能、使用界面及文件定位等方面。不足就是每天只能免费上传2个文件
Copilot
Copilot也就是之前的new bing,可以看到微软的edge浏览器自带了Copilot插件,在浏览器的右上角的copilot logo。打开pdf文件后,点击copilot logo就会显示相应的功能项:
- 生成文件摘要
- 请提出关于这份文件的问题
- 从此文件生成关键见解
生成文件摘要
手册简介:《Java 开发手册》是阿里巴巴和开课吧技术团队的经验总结,经过实战检验并不断完善。最新版本为黄山版,涵盖了编程规约、异常日志、单元测试等七个维度。
**编程规约:**手册提供了详细的编程规约,包括命名风格、代码格式、OOP 规约等,旨在提高代码质量和协作效率。
**规约分类:**规约分为【强制】、【推荐】、【参考】三类,以不同的约束力度指导开发者。
**附加资源:**手册配套有 IDE 插件和《码出高效》图书,提供了更多编程知识和实践经验。手册和图书的收入均捐赠公益事情。
摘要的简单,但又把文件中所有的内容都有提到。
这时你会想,我想了解更具体点的摘要,不要担心,copilot也有考虑到。
你可以点击"显示更多摘要"会进一步出来。
提问+定位能力
copilot不支持上传图片以外的文件,但可以通过edge浏览器打开,再使用copilot插件与文件对话
相同的问题,既然没找出来。
换个问题,是可以找出来的
文件中"浮点数类型的数值后缀统一为大写的 D 或 F"这条约定中,作者使用的例子中变量WEIGHT的数值是多少?并指出数值在文档的出处?
当然copilot是可以完全免费使用,它是包括文本语言、搜索引擎、绘画、翻译、阅读、编码等综合型AI产品。
当然像chatgpt、kimi等等这些不支持预览文件的AI,也可以通过上传文件的方式来实现对文件内容的解读。
在这个信息爆炸的时代,高效获取和处理知识真的太重要了。可以看到AI在帮我们阅读文献方面真的特别给力。想想那些500甚至上千页的PDF文件,以前看一眼就头疼,现在有了AI,根本不用一页一页地啃了。
其它AI阅读工具
司马阅SmartRead
司马阅SmartRead是一款国内的AI文件阅读工具,提供智能阅读、AI摘要、AI问答等服务。
讯飞星火知识库文件问答
讯飞星火知识库文件问答提供Al分析、阅读、问答工具,让大模型助你高效了解文件内容。
用户可以免费使用,可以对我的问题分析和定位到文件出处。
WPS AI
PDF AI 支持总结长文信息、追溯原文、外文翻译提炼等文章处理任务,助你轻松高效阅读 PDF科研论文、报告、产品手册、法律合同、书籍等文件。
总结
可以看到不少统计网站,它们收集了全球出现的AI产品,从这些网站大概可以了解的目前全球已经出现1.5w+的AI产品,其中中国也已经超1000+。短短的1年多AI产品如雨后春笋般大量出现。AI已经覆盖了很多类别,包括聊天、绘图、阅读、写作、翻译等等。
在AI辅助阅读工具这块我们可以发现它们具有共同的特征:
-
摘要总结:能够生成文件的摘要。
-
智能问答:用户可以向工具提问、聊天。
-
多语言支持:支持多语言翻译能力。
-
国外花钱
可以选择chatgpt-4:gpt是综合性AI产品,集文本语言、搜索、绘画、翻译、阅读、编码以一身的综合型AI产品。
- 国内不花钱
专注于文献的可以选择司马阅SmartRead试试,当然kimi是综合性AI产品,虽然没有文档预览效果的,但功能也非常强大。
- 国内花钱
如果只可以选择专注于文献ChatDOC。
对于需要使用要非常简单好用的人来说花点钱或许是更好的选择,这类AI会更专注某个领域的功能。
对于一些技术人员来说,不想花钱就可以选择new bing、kimi这类的免费的综合性AI产品。
我是栈江湖,如果你喜欢此文章,不要忘记点赞+关注!