『 笔者将持续跨领域学习获取通用认知,致力于帮助大家进行结构化知识梳理,你的关注和支持是阿Yong持续分享的动力。 』
前几天一位朋友发来消息:"ai-bot.cn, 这些工具,你觉得哪些好用?" 打开网站一看,700多款AI工具,一时间甚至要怀疑"我从哪里来,要到哪里去"。对于"该用哪个好"这个问题,实际上有两种方法可以结合:
- "是骡子是马拉出来溜溜" :首先通用大语言模型(LLM)是能解决问题的范围最广的,或者说,凡是可以通过信息处理、逻辑推理与内容生成解决的问题,都可以找大模型解决。那么,"用什么工具"的问题,可以转化为"选什么大模型"的问题。我们可以直接与大模型进行对话,通过大模型的反馈来判断模型的思维、理解和解决的能力等。对大多数人而言,直接聊聊天就能看出大模型"脑袋瓜聪不聪明",当然,也可以参考学术机构或行业通过标准测评排行榜(如MMLU等)给出的成绩。
- 溯本求源:如果有兴趣深入研究的话,了解模型层的理论依据和实现原理,硬件支持和训练数据集,会对AI的理解与应用有所帮助。
笔者结合近两年与通用大语言模型约1万5千次对话的体验、同行老师的分享以及前沿资讯,愿意为AI提效相关主题做一些梳理工作,分享一些心得与实践经验。
本文旨在梳理跨领域通用型AI模型或产品,作为速查清单,涵盖对话、编程、视觉、音视频等基础创作场景(不讨论金融、法律、医疗、教育等依赖专有知识库的垂直场景工具),附带简评和链接。本文内容会随时间更新迭代,当前是2025年3月8日版。通篇内容排序不分先后。
对话与写作
通用大语言模型是目前人工智能的核心载体,前面我们也提到,其本质是"通用信息处理器"。对话与写作任务,实际上就是考验大模型的语义理解、逻辑连贯性及知识广度的任务,映射了通用智能的边界。因而我们列举的第一个应用类型"对话与写作类",也就是"通用大模型类。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
Claude | AI 助手,用于写作、逻辑推理、PPT生成、个人助理 | 支持生成思维导图/海报;通过 Project 功能打造个性化 AI 助理;模型采用 Claude 3.5 Sonnet(逻辑强,写作自然) |
Gemini | 免费多模态 AI 模型,支持文本、图片、视频交互 | 支持实时视频对话(需特殊网络环境);盲测评分高,长上下文(100万 Token);完全免费 |
ChatGPT | 多模态对话与写作 | 自然语言生成、情绪模拟;适用于各种写作和对话场景; Deep research 亲测很强。 |
豆包 | 自然语音对话 AI | 中文语境理解优异、防电诈设计;适合陪聊、口语练习、实时问答 |
DeepSeek R1 | 创意写作与开源部署 | 强调创意写作效果,适用于代码创作和深度文本生成 |
Claude 3.7 | 技术文档专家、代码注释优化 | 专注于技术文档和代码注释;在处理技术问题上表现出色 |
Grok | 捕捉网络热梗、抽象风格输出 | 能捕捉网络热点和抽象表达;适合生成幽默或创意内容 |
计算机编程
该类别主要包括智能化的代码编辑器和补全插件两种形态,本文对该类别简单列举,笔者在未来的文章中会结合更多资讯和日常使用体验进行深入探讨。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
Cursor | 代码编辑器,智能重构引擎 | 对AI编程的维度性提升,深入理解整个项目上下文,实现自动代码生成与优化 |
Windsurf | 代码编辑器 | 界面友好,适合初学者使用,同时具备代码安全扫描功能 |
Trae | 代码编辑器,免费 Claude 3.7 集成 | 专注中文用户界面优化,提供便捷的代码生成与修改体验 |
Github Copilot | 智能补全插件,GPT-4 驱动 | 由 GitHub 开发,适合全栈工程师及跨国团队 |
通义灵码 | 智能补全插件,中文代码优化/免费服务稳定 | 由 阿里云 开发,适合本土开发者及中小企业 |
图片生成与处理
涵盖AI绘画、图像编辑、风格迁移等工具,支持文生图、图生图、商业设计等视觉内容创作场景。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
即梦 | 绘画工具 | 中文提示词精准解析,专注国风插画和节气海报 |
可图 | 绘画工具 | 电商换衣技术成熟,适合服装类目电商优化 |
Whisk | 多图组合创新工具 | 采用多图组合生成新图,适合 IP 形象场景移植 |
Recraft.ai | 商业设计 AI 工具 | 提供商业设计闭环支持,适用于品牌 VI 系统构建 |
ImageFX | 图像生成工具 | 专注光影细节处理,生成高真实度图像 |
Midjourney | 专业级 AI 绘画工具 | 高质量艺术创作,适用于概念设计和艺术创作 |
Stable Diffusion | 专业级 AI 绘画工具 | 开源灵活,生成效果优异,社区活跃,支持二次开发 |
DALL-E 3 | 专业级 AI 绘画工具 | 生成细节丰富、创意出众,广受媒体和创作者好评,是 OpenAI 的明星产品 |
视频生成与处理
包含视频自动生成、动态特效合成、多镜头剪辑工具,支持短视频创作、影视级特效及智能剪辑需求。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
可灵 | AI 视频处理工具 | 动作流畅度行业标杆,适合短视频创作者 |
Pika | 视频特效与动态元素处理工具 | 以动态元素融合创新,适合特效爱好者 |
Runway | 专业视频生成与编辑工具 | 影视级视频生成和特效编辑,广泛应用于影视从业者 |
Vidu | AI 视频生成工具 | 中文提示词友好,适合新手用户,支持图文混合展示 |
音乐创作
涵盖AI作曲、编曲配器、风格化音效生成工具,适配背景音乐制作、个性化铃声定制等场景。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
Suno | 音乐创作工具 | 擅长 Lofi 音乐生成,适合 YouTube 内容创作 |
海绵音乐 | AI 音乐生成工具 | 平民化音乐生成,易于上手,适用于日常配乐制作 |
MusicFX | AI 音乐创作工具 | 简单易用且高质量,专注于 LoFi 音乐生成 |
搜索工具
整合多源检索、知识图谱构建、可信度验证工具,服务于学术研究、商业情报及日常信息查询。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
Perplexity | AI 搜索引擎 | 支持多轮复杂问题检索,引用权威信息来源,Pro 模式提升检索深度 |
Felo/点点 | AI 搜索工具(基于小红书内容) | 利用小红书笔记回答生活问题,支持图文混合展示,内容质量优于传统搜索引擎 |
纳米AI搜索 | AI 搜索工具 | 多角色查证机制,事实错误率低(12%) |
秘塔搜索 | AI 搜索工具(文献翻译及知识库构建) | 外文转换准确率高(89%),适合学术文献和专业资料检索 |
(注:本类工具检索结果不代表本公众号观点,请自行核实信息准确性)
其他办公辅助工具
覆盖文档自动化生成、多模态内容优化及语音交互增强工具,支持PPT智能设计、语音笔记整理、声纹克隆等场景,适配会议记录、汇报材料制作及个性化语音服务需求。
工具名称 | 核心功能 | 特色优势 |
---|---|---|
Gamma | AI 生成 PPT 工具 | 输入主题/文本自动生成专业 PPT;支持 AI 配图、多模板选择;可优化现有 PPT 或导入文档生成 |
Get 笔记 | 语音转文字工具,优化笔记和文章 | 一键润色语音内容、去除口癖;支持 OCR 识别图片文字并排版;可总结视频/直播内容 |
海螺AI | 语音处理工具(声音克隆与文本转语音) | 声音克隆精度高(98.7%),支持多语言,免费使用;每日签到可获取免费时长 |
AI Agent
AI Agent 是未来的趋势,可以简单理解为能独立工作的AI,服务于自动化办公、深度调研、创意协作及智能决策等场景。该类型由于小编的信息不够成熟,暂时不包含对"特色优势"的描述。
工具名称 | 核心功能 |
---|---|
Manus | 通用型自主 Agent |
OpenManus | 据介绍是3小时撸出来的开源版Manus... |
Altera | 人性化交互与长期学习型 Agent |
OpenAI DeepResearch | 深度资料检索与分析 Agent |
AutoGPT | 开源自主代理框架 |
Google Gemini Agent | 企业级智能代理,集成 Google 生态 |
Thanks
后续小编或将分享 AI 辅助编程最佳实践心得体会或大模型相关知识与体验。希望通过结构化梳理与思考能够对大家有所帮助,感谢关注。
只有站在巨人的肩膀上我们才能"更上一层楼",感谢以下老师提供的资讯与帮助:
- DeepSeek
- ChatGPT
- Hacking4fun 的文章
- 田威AI 的文章
- AI-Fan AI研究室-帆哥的视频
- 封面与插图:Xu Haiwei@unsplash
『 本文于 2025-03-09 首发于 "又知道了阿Yong"@微信公众号@稀土掘金。 』