不畏浮云遮望眼-通用AI工具速查清单

『笔者将持续跨领域学习获取通用认知，致力于帮助大家进行结构化知识梳理，你的关注和支持是阿Yong持续分享的动力。』

前几天一位朋友发来消息："ai-bot.cn，这些工具，你觉得哪些好用？" 打开网站一看，700多款AI工具，一时间甚至要怀疑"我从哪里来，要到哪里去"。对于"该用哪个好"这个问题，实际上有两种方法可以结合：

"是骡子是马拉出来溜溜" ：首先通用大语言模型（LLM）是能解决问题的范围最广的，或者说，凡是可以通过信息处理、逻辑推理与内容生成解决的问题，都可以找大模型解决。那么，"用什么工具"的问题，可以转化为"选什么大模型"的问题。我们可以直接与大模型进行对话，通过大模型的反馈来判断模型的思维、理解和解决的能力等。对大多数人而言，直接聊聊天就能看出大模型"脑袋瓜聪不聪明"，当然，也可以参考学术机构或行业通过标准测评排行榜（如MMLU等）给出的成绩。
溯本求源：如果有兴趣深入研究的话，了解模型层的理论依据和实现原理，硬件支持和训练数据集，会对AI的理解与应用有所帮助。

笔者结合近两年与通用大语言模型约1万5千次对话的体验、同行老师的分享以及前沿资讯，愿意为AI提效相关主题做一些梳理工作，分享一些心得与实践经验。

本文旨在梳理跨领域通用型AI模型或产品，作为速查清单，涵盖对话、编程、视觉、音视频等基础创作场景（不讨论金融、法律、医疗、教育等依赖专有知识库的垂直场景工具），附带简评和链接。本文内容会随时间更新迭代，当前是2025年3月8日版。通篇内容排序不分先后。

对话与写作

通用大语言模型是目前人工智能的核心载体，前面我们也提到，其本质是"通用信息处理器"。对话与写作任务，实际上就是考验大模型的语义理解、逻辑连贯性及知识广度的任务，映射了通用智能的边界。因而我们列举的第一个应用类型"对话与写作类"，也就是"通用大模型类。

工具名称	核心功能	特色优势
Claude	AI 助手，用于写作、逻辑推理、PPT生成、个人助理	支持生成思维导图/海报；通过 Project 功能打造个性化 AI 助理；模型采用 Claude 3.5 Sonnet（逻辑强，写作自然）
Gemini	免费多模态 AI 模型，支持文本、图片、视频交互	支持实时视频对话（需特殊网络环境）；盲测评分高，长上下文（100万 Token）；完全免费
ChatGPT	多模态对话与写作	自然语言生成、情绪模拟；适用于各种写作和对话场景； Deep research 亲测很强。
豆包	自然语音对话 AI	中文语境理解优异、防电诈设计；适合陪聊、口语练习、实时问答
DeepSeek R1	创意写作与开源部署	强调创意写作效果，适用于代码创作和深度文本生成
Claude 3.7	技术文档专家、代码注释优化	专注于技术文档和代码注释；在处理技术问题上表现出色
Grok	捕捉网络热梗、抽象风格输出	能捕捉网络热点和抽象表达；适合生成幽默或创意内容

计算机编程

该类别主要包括智能化的代码编辑器和补全插件两种形态，本文对该类别简单列举，笔者在未来的文章中会结合更多资讯和日常使用体验进行深入探讨。

工具名称	核心功能	特色优势
Cursor	代码编辑器，智能重构引擎	对AI编程的维度性提升，深入理解整个项目上下文，实现自动代码生成与优化
Windsurf	代码编辑器	界面友好，适合初学者使用，同时具备代码安全扫描功能
Trae	代码编辑器，免费 Claude 3.7 集成	专注中文用户界面优化，提供便捷的代码生成与修改体验
Github Copilot	智能补全插件，GPT-4 驱动	由 GitHub 开发，适合全栈工程师及跨国团队
通义灵码	智能补全插件，中文代码优化/免费服务稳定	由阿里云开发，适合本土开发者及中小企业

图片生成与处理

涵盖AI绘画、图像编辑、风格迁移等工具，支持文生图、图生图、商业设计等视觉内容创作场景。

工具名称	核心功能	特色优势
即梦	绘画工具	中文提示词精准解析，专注国风插画和节气海报
可图	绘画工具	电商换衣技术成熟，适合服装类目电商优化
Whisk	多图组合创新工具	采用多图组合生成新图，适合 IP 形象场景移植
Recraft.ai	商业设计 AI 工具	提供商业设计闭环支持，适用于品牌 VI 系统构建
ImageFX	图像生成工具	专注光影细节处理，生成高真实度图像
Midjourney	专业级 AI 绘画工具	高质量艺术创作，适用于概念设计和艺术创作
Stable Diffusion	专业级 AI 绘画工具	开源灵活，生成效果优异，社区活跃，支持二次开发
DALL-E 3	专业级 AI 绘画工具	生成细节丰富、创意出众，广受媒体和创作者好评，是 OpenAI 的明星产品

视频生成与处理

包含视频自动生成、动态特效合成、多镜头剪辑工具，支持短视频创作、影视级特效及智能剪辑需求。

工具名称	核心功能	特色优势
可灵	AI 视频处理工具	动作流畅度行业标杆，适合短视频创作者
Pika	视频特效与动态元素处理工具	以动态元素融合创新，适合特效爱好者
Runway	专业视频生成与编辑工具	影视级视频生成和特效编辑，广泛应用于影视从业者
Vidu	AI 视频生成工具	中文提示词友好，适合新手用户，支持图文混合展示

音乐创作

涵盖AI作曲、编曲配器、风格化音效生成工具，适配背景音乐制作、个性化铃声定制等场景。

工具名称	核心功能	特色优势
Suno	音乐创作工具	擅长 Lofi 音乐生成，适合 YouTube 内容创作
海绵音乐	AI 音乐生成工具	平民化音乐生成，易于上手，适用于日常配乐制作
MusicFX	AI 音乐创作工具	简单易用且高质量，专注于 LoFi 音乐生成

搜索工具

整合多源检索、知识图谱构建、可信度验证工具，服务于学术研究、商业情报及日常信息查询。

工具名称	核心功能	特色优势
Perplexity	AI 搜索引擎	支持多轮复杂问题检索，引用权威信息来源，Pro 模式提升检索深度
Felo/点点	AI 搜索工具（基于小红书内容）	利用小红书笔记回答生活问题，支持图文混合展示，内容质量优于传统搜索引擎
纳米AI搜索	AI 搜索工具	多角色查证机制，事实错误率低（12%）
秘塔搜索	AI 搜索工具（文献翻译及知识库构建）	外文转换准确率高（89%），适合学术文献和专业资料检索

(注：本类工具检索结果不代表本公众号观点，请自行核实信息准确性)

其他办公辅助工具

覆盖文档自动化生成、多模态内容优化及语音交互增强工具，支持PPT智能设计、语音笔记整理、声纹克隆等场景，适配会议记录、汇报材料制作及个性化语音服务需求。

工具名称	核心功能	特色优势
Gamma	AI 生成 PPT 工具	输入主题/文本自动生成专业 PPT；支持 AI 配图、多模板选择；可优化现有 PPT 或导入文档生成
Get 笔记	语音转文字工具，优化笔记和文章	一键润色语音内容、去除口癖；支持 OCR 识别图片文字并排版；可总结视频/直播内容
海螺AI	语音处理工具（声音克隆与文本转语音）	声音克隆精度高（98.7%），支持多语言，免费使用；每日签到可获取免费时长

AI Agent

AI Agent 是未来的趋势，可以简单理解为能独立工作的AI，服务于自动化办公、深度调研、创意协作及智能决策等场景。该类型由于小编的信息不够成熟，暂时不包含对"特色优势"的描述。

工具名称	核心功能
Manus	通用型自主 Agent
OpenManus	据介绍是3小时撸出来的开源版Manus...
Altera	人性化交互与长期学习型 Agent
OpenAI DeepResearch	深度资料检索与分析 Agent
AutoGPT	开源自主代理框架
Google Gemini Agent	企业级智能代理，集成 Google 生态

Thanks

后续小编或将分享 AI 辅助编程最佳实践心得体会或大模型相关知识与体验。希望通过结构化梳理与思考能够对大家有所帮助，感谢关注。

只有站在巨人的肩膀上我们才能"更上一层楼"，感谢以下老师提供的资讯与帮助：

DeepSeek
ChatGPT
Hacking4fun 的文章
田威AI 的文章
AI-Fan AI研究室-帆哥的视频
封面与插图：Xu Haiwei@unsplash

『本文于 2025-03-09 首发于 "又知道了阿Yong"@微信公众号@稀土掘金。』