AI 大模型零基础知识扫盲
更新时间:2026-06-22
适合读者:没有从事过 AI、编程、算法、数据科学的人。文科生、产品、运营、市场、设计、管理者、学生都可以从这里开始。
阅读目标:看完之后,你不需要懂模型训练细节,但应该能听懂主流 AI 讨论,知道国内外主流模型和工具大概能做什么,并能开始把 AI 用到学习、工作和个人项目里。
这份文档只介绍当前仍值得关注的主流模型和工具,不把过旧版本当重点。AI 产品变化极快,具体价格、模型名、免费额度、地区可用性请以官网为准。读者不需要死记每个小版本号,更重要的是知道每家公司和工具适合什么任务。
一句话理解 AI 大模型
AI 大模型可以先理解成一个"读过海量文字、代码、图片说明、网页和资料的超级语言助手"。你给它一句话、一个文件、一张图、一个任务,它会根据上下文生成回答、计划、表格、代码、图片描述、总结或执行步骤。
它不像人一样真正"懂世界",也不是数据库。它更像一个极强的"预测和组织信息的机器":根据你给的内容和它学过的规律,猜出最可能有用的下一段内容。
所以使用 AI 的核心不是"问它一个神奇问题",而是:
- 把你的目标说清楚。
- 把背景资料给足。
- 让它按你需要的格式输出。
- 对关键事实、人名、日期、金额、法律、医学、财务结论做核查。
大模型能做什么
它特别擅长
- 写作:邮件、方案、脚本、公众号、短视频口播、课程大纲、会议纪要。
- 总结:长文、论文、财报、聊天记录、访谈录音转写稿。
- 改写:把复杂内容改成大白话,把口语改成正式文案,把中文改成英文。
- 翻译:中英互译、多语言翻译、保留语气和行业表达。
- 头脑风暴:起标题、想活动方案、列选题、找角度。
- 资料整理:把散乱信息变成表格、清单、时间线、FAQ。
- 学习辅导:解释概念、出练习题、模拟面试、做学习计划。
- 数据初步分析:读 CSV、Excel、调研问卷,找趋势和异常。
- 编程辅助:读代码、写小工具、修 bug、生成网页、解释报错。
- 多模态任务:看图、识别截图、描述视频、生成图片、生成语音、生成短视频。
- 自动执行:在授权范围内操作浏览器、读写文件、调用工具、跑脚本、开 PR。
它不可靠的地方
- 可能一本正经地说错,这叫"幻觉"。
- 可能不知道最新信息,除非工具本身接入搜索或你给它资料。
- 不适合作为唯一的医学、法律、金融、投资决策依据。
- 不应该处理你无权上传的敏感数据,比如客户隐私、公司机密、身份证、合同原件。
- 它生成的内容可能带有偏见、模板味,重要内容需要人再判断。
最重要的心智模型
1. 模型、产品、工具不是一回事
很多人会把"ChatGPT""GPT 系列模型""OpenAI""Codex"混在一起。可以这样区分:
| 名词 | 大白话解释 | 例子 |
|---|---|---|
| 模型 | 真正负责思考和生成内容的"发动机" | GPT-5.x、Claude 4.x、Gemini 3.x/2.5、DeepSeek、Qwen、GLM |
| 产品 | 普通用户直接打开使用的 App 或网站 | ChatGPT、Claude、Gemini、Kimi、豆包、通义、文小言、腾讯元宝 |
| 工具 | 为某类任务包装好的工作软件 | Codex、Cursor、Qoder、Trae、Claude Code、GitHub Copilot |
| API | 给开发者调用模型的接口 | OpenAI API、Gemini API、DeepSeek API、阿里云百炼、火山方舟 |
| 平台 | 管模型、账号、账单、安全、部署的一整套服务 | AWS Bedrock、Vertex AI、Azure AI Foundry、阿里云百炼、百度千帆 |
2. "大"不一定等于"适合你"
最强模型通常更贵、更慢,但适合复杂推理、长文档、编程、战略分析。小模型通常更便宜、更快,适合客服、批量分类、改写、摘要、信息抽取。
普通人选模型时,不用追参数数量,优先看这几个问题:
- 我要不要联网搜索?
- 我要不要读图片、PDF、表格、网页?
- 我要不要写代码或改代码?
- 我要不要中文特别好?
- 我要不要长文档上下文?
- 我要不要便宜、快、可批量调用?
- 我要不要本地部署或开源可控?
3. AI 的输出质量,常常取决于你给的上下文质量
你问:"帮我写一份方案",它只能写通用模板。
你给它:目标人群、预算、城市、时间、过去数据、老板偏好、竞品资料、输出格式,它就能写出更像真实工作的方案。
更好的提问公式:
text
你是[角色]。
我要完成[目标]。
背景是[必要资料]。
受众是[谁看]。
限制是[字数/语气/预算/合规/时间]。
请输出为[表格/清单/大纲/邮件/JSON/Markdown]。
如果信息不够,先问我最多 3 个问题。
国内外主流大模型速览
下面不是严格排行榜,而是入门者应该知道的"主流玩家地图"。具体模型名会变,重要的是知道每家大概擅长什么。表格里的版本写法用于提示当前主流方向,不建议把它当成固定不变的清单。
海外主流模型
| 公司/组织 | 当前重点模型或系列 | 你可以怎么理解 | 典型入口 |
|---|---|---|---|
| OpenAI | GPT-5.5、GPT-5.4、GPT-5.4 mini/nano,另有图像、音频、视频、Embedding 等专用模型 | 综合能力强,复杂推理、代码、工具调用、专业工作流非常主流 | ChatGPT、OpenAI API、Codex |
| Anthropic | Claude Opus 4.8、Claude Sonnet 4.6、Claude Haiku 4.5 | 长文、写作、代码、稳健对话和企业使用口碑强 | Claude、Claude API、Claude Code |
| Google DeepMind | Gemini 3.1 Pro、Gemini 3.5 Flash、Gemini 3 Flash、Gemini 3.1 Flash-Lite,Nano Banana、Veo 等多媒体模型 | 多模态和 Google 生态强,搜索、安卓、办公、开发者平台结合深 | Gemini、Google AI Studio、Vertex AI |
| xAI | Grok 4.3,另有图像、视频、语音和代码方向模型 | 和 X 平台、实时信息、对话体验联系紧 | Grok、xAI API |
| Meta | Llama 系列、Llama 4 系列及后续开放权重模型 | 开放生态影响大,适合研究、本地部署、企业私有化 | Hugging Face、Meta 官方、云平台 |
| Mistral AI | Mistral Large、Mixtral、Ministral、Pixtral 等 | 欧洲代表,开放权重和企业部署生态活跃 | Le Chat、Mistral API、云平台 |
| Cohere | Command 系列、Embed、Rerank | 企业搜索、知识库、RAG、文本理解场景常见 | Cohere API、企业平台 |
| Perplexity | Sonar/搜索问答模型和搜索产品 | 更像"会给来源的 AI 搜索引擎" | Perplexity |
| Microsoft | Copilot 生态,通常结合 OpenAI 和微软自有模型 | 办公、Windows、GitHub、企业协作入口强 | Microsoft Copilot、GitHub Copilot、Azure |
| Amazon | Nova 系列、Bedrock 上的多模型平台 | 企业云平台入口,能统一用多家模型 | Amazon Bedrock |
入门建议:
- 想要综合最强和工具生态:先试 ChatGPT、Claude、Gemini。
- 想要搜索资料:试 Perplexity、Gemini、ChatGPT 搜索、Kimi Deep Research。
- 想要编程:试 Codex、Cursor、Claude Code、Qoder、Trae。
- 想要企业私有化或开源生态:关注 Llama、Qwen、DeepSeek、GLM、Mistral。
国内主流模型
| 公司/组织 | 当前重点模型或系列 | 你可以怎么理解 | 典型入口 |
|---|---|---|---|
| DeepSeek 深度求索 | DeepSeek-V4-Pro、DeepSeek-V4-Flash,兼顾思考与非思考模式 | 性价比、推理、代码、开源影响力强 | DeepSeek 网页/APP、DeepSeek API、开源模型 |
| 阿里通义千问 Qwen | Qwen3-2507、Qwen3-Instruct、Qwen3-Thinking、多模态 Qwen 系列 | 中文、代码、开源生态、企业云生态都强 | 通义、Qwen Chat、阿里云百炼、ModelScope |
| 智谱/Z.ai | GLM-5.2、GLM-5.1、GLM-5 | 长任务、Agent、代码工程、开源权重是重点 | 智谱清言/Z.ai、BigModel、GitHub/Hugging Face |
| 月之暗面 Moonshot | Kimi、Kimi Deep Research、Kimi Code、Kimi Slides/Docs/Sheets | 长文档、资料阅读、研究、办公生成很适合普通用户 | Kimi 网页/APP、Kimi API |
| 字节跳动 | 豆包、Doubao 系列、火山方舟 | C 端产品体验、语音、视频、图像、办公和云平台入口强 | 豆包、Trae、火山方舟 |
| 百度 | 文小言/文心、ERNIE/文心大模型、千帆平台 | 搜索、知识增强、企业平台、中文生态积累深 | 文小言、百度智能云千帆 |
| 腾讯 | 混元、腾讯元宝、腾讯云 TI 平台 | 微信/QQ/腾讯文档生态、办公与企业接入潜力大 | 腾讯元宝、腾讯云混元 |
| MiniMax | MiniMax、海螺 AI、语音/视频/Agent 相关模型 | 对话、语音、视频和 Agent 产品活跃 | MiniMax API、海螺 AI |
| 阶跃星辰 StepFun | Step 系列模型 | 多模态、长上下文、中文模型圈重要玩家 | 阶跃星辰产品与 API |
| 零一万物 01.AI | Yi 系列 | 开放模型和中文英文能力曾有较大影响,仍可作为开源生态了解 | 01.AI、Hugging Face |
| 美团 LongCat | LongCat 系列 | 面向效率和工程任务的国内开源模型之一 | GitHub、ModelScope、相关 API |
| 华为 | 盘古大模型 | 政企、行业模型、国产化部署生态 | 华为云盘古 |
入门建议:
- 中文资料阅读和长文档:Kimi、通义、DeepSeek、文小言、腾讯元宝都值得试。
- 写代码和做工程 Demo:DeepSeek、Qwen、GLM、Trae、Qoder、通义灵码。
- 做企业内部知识库:阿里云百炼、百度千帆、腾讯云混元、火山方舟、华为云盘古。
- 做内容创作和视频图片:豆包、可灵、海螺、通义万相、即梦等更像工具入口。
主流 AI 工具地图
这一章重点先看国内工具。原因很现实:国内工具通常访问更方便,中文资料处理更顺,很多支持微信、飞书、钉钉、腾讯文档、WPS、阿里云、火山方舟等本土工作环境。海外工具仍然值得了解,但对普通新手来说,先用顺手的国内工具把工作流跑起来更重要。
国内工具优先怎么选
| 你要做什么 | 国内优先工具 | 大白话建议 |
|---|---|---|
| 日常问答、写作、翻译 | 豆包、Kimi、通义、文小言、腾讯元宝 | 先随便选 2 个长期用,比较谁更懂你的表达习惯。 |
| 长文档、PDF、资料阅读 | Kimi、通义、腾讯元宝、文小言 | Kimi 很适合长资料和研究;腾讯元宝适合腾讯生态资料;通义适合办公和云生态。 |
| 搜索和资料调研 | Kimi Deep Research、文小言、通义、腾讯元宝 | 让它标注来源和时间,关键结论回原网页核对。 |
| PPT、文档、表格 | Kimi Slides/Docs/Sheets、通义、WPS AI、腾讯文档 AI、飞书智能伙伴 | 先让 AI 做大纲和结构,再人工改版式。 |
| 图片和视频 | 豆包、即梦、可灵、通义万相、海螺 AI | 做海报、短视频、分镜、商品图,注意版权和品牌规范。 |
| 语音和会议 | 通义听悟、飞书妙记、腾讯会议 AI、讯飞听见 | 用来转写、总结、提取行动项。 |
| 搭机器人和知识库 | 扣子/Coze、Dify、FastGPT、飞书知识问答、阿里云百炼、火山方舟 | 适合客服 FAQ、公司制度问答、产品文档助手。 |
| 写代码、做 Demo、批量处理文件 | Trae、Qoder、通义灵码、豆包 MarsCode、百度 Comate、腾讯云 CodeBuddy | 这类工具已经不只是写代码,而是能帮你操作项目、生成网页、整理文件、写脚本。 |
通用聊天和办公助手
| 工具 | 国内/海外 | 适合做什么 | 适合谁 |
|---|---|---|---|
| Kimi | 国内 | 长文档阅读、资料总结、PPT/网页/表格生成、深度研究 | 文档工作多的人 |
| 豆包 | 国内 | 日常问答、写作、语音、图像、视频生态 | 普通用户、内容创作者 |
| 通义 | 国内 | 中文问答、办公、开发、企业模型平台 | 普通用户、企业用户 |
| 文小言 | 国内 | 搜索问答、中文写作、百度生态 | 中文搜索和内容用户 |
| 腾讯元宝 | 国内 | 微信生态资料处理、长文精读、日常办公 | 腾讯生态用户 |
| WPS AI | 国内 | Word、PPT、Excel 类办公文档处理 | 经常写材料、做表格、做汇报的人 |
| 飞书智能伙伴 | 国内 | 飞书文档、会议、知识库、组织协作 | 使用飞书的团队 |
| 钉钉 AI | 国内 | 企业沟通、审批、文档、知识问答 | 使用钉钉的团队 |
| ChatGPT | 海外 | 通用问答、写作、分析、图片理解、数据处理、代码、研究 | 几乎所有人 |
| Claude | 海外 | 长文写作、长文档阅读、代码、稳健对话 | 写作者、产品、研究、开发 |
| Gemini | 海外 | 搜索、图片/视频理解、Google 生态、语音、多模态 | 用 Google 生态的人 |
| Perplexity | 海外 | 带来源的搜索问答、快速调研 | 学生、研究、市场、运营 |
| Microsoft Copilot | 海外 | Office、Teams、Windows、企业办公 | 企业用户、办公用户 |
AI 编程和 Agent 工具:不只是写代码,而是"万能工作台"
即使不是程序员,也建议重点了解这一类工具。它们名字叫"编程工具",但实际能力已经接近"电脑工作代理":能读文件夹、理解项目、改文件、写脚本、生成网页、处理 CSV、整理 Markdown、批量重命名、把 Word/PDF 内容转成结构化资料,甚至帮你把一个想法做成可点击的 Demo。
你可以把它们理解成"能动手的 AI"。普通聊天工具更像顾问,告诉你应该怎么做;编码/Agent 工具更像助理,可以在你的电脑或项目里直接改文件、生成文件、跑验证、整理结果。
| 工具 | 国内/海外 | 大白话介绍 | 非程序员能怎么用 |
|---|---|---|---|
| Trae | 国内 | 字节系 AI IDE/Agent 工具,适合从一句需求开始做网页、应用、脚本和项目修改 | 做产品 Demo、生成落地页、处理文件、写自动化脚本、解释项目 |
| Qoder | 国内/国际 | 面向 Agentic Coding 的开发平台,强调理解代码库、拆任务、执行实现、长期项目知识 | 让 AI 读项目、写需求、做实现、批量改文件、整理工程文档 |
| 通义灵码 | 国内 | 阿里系 AI 编程助手,常见于 IDE 插件和企业研发流程 | 补全代码、解释代码、生成接口、写测试、帮助新人读项目 |
| 豆包 MarsCode | 国内 | 字节系云端/IDE 编程助手,适合在线开发、学习编程、快速做小项目 | 不装复杂环境也能写页面、跑示例、做 Demo |
| 百度 Comate | 国内 | 百度智能代码助手,偏企业研发提效 | 代码问答、代码生成、解释历史项目、辅助排查问题 |
| 腾讯云 CodeBuddy | 国内 | 腾讯云代码助手,适合腾讯云和企业研发场景 | 生成代码、解释代码、研发协同、云上项目辅助 |
| CodeGeeX | 国内 | 智谱系代码助手,支持代码生成、补全、翻译和解释 | 学习代码、处理脚本、生成小工具 |
| Codex | 海外 | OpenAI 的编程/工作代理,可以读代码库、改文件、跑命令、做 PR、查文档 | 让它做网页原型、改文档、整理项目、修简单 bug |
| Cursor | 海外 | AI 原生代码编辑器,有补全、聊天、Agent、CLI、代码库理解 | 做小网站、自动化表格、批量处理文本 |
| Claude Code | 海外 | Anthropic 的命令行编程代理,擅长长任务和代码库理解 | 让它在项目里改代码、写脚本、解释代码 |
| GitHub Copilot | 海外 | 和 GitHub、VS Code 深度结合的编程助手 | 帮开发团队写代码、查问题、生成测试 |
| Gemini CLI | 海外 | Google 的开源命令行 AI Agent,把 Gemini 放进终端 | 技术用户用它处理项目任务 |
| Devin / Devin Desktop | 海外 | 面向软件工程任务的 AI Agent 产品 | 让 Agent 接需求、开发、跑验证、交付结果 |
| Replit Agent | 海外 | 在浏览器里做应用的 AI 开发环境 | 不装环境也能做小应用 |
这些工具"什么都能干"的本质,是它们能把自然语言变成文件操作和自动化流程:
| 你说的话 | 它实际可能做的事 |
|---|---|
| "帮我做一个客户管理小网页" | 生成页面、组件、假数据、筛选、弹窗、样式。 |
| "把这个 CSV 整理成月报" | 写脚本读取 CSV、统计指标、生成 Markdown 或 Excel。 |
| "把这一堆 Markdown 统一格式" | 扫描文件夹、批量修改标题、表格、链接、目录。 |
| "帮我把图片文件按日期重命名" | 写批处理脚本,先演示规则,再执行。 |
| "这个项目我看不懂,帮我讲一下" | 读取目录结构,解释每个文件职责,画出模块关系。 |
| "把 Word 里的需求做成网页 Demo" | 提取需求、拆页面、生成前端代码和假数据。 |
| "帮我检查哪里可能有问题" | 读代码、找风险、跑静态检查或给人工检查清单。 |
非程序员使用 AI 编程工具的关键心法:
- 你不用先学完整编程,但要会描述"我要什么页面、什么交互、什么输入输出"。
- 先让 AI 写需求和计划,再让它动手实现,不要一上来就"直接开干"。
- 要求它"每次只改必要文件",并解释改了什么。
- 让它先做小版本:比如先做 1 个页面、1 个表格、1 个脚本,确认对了再扩展。
- 不懂命令时,让它解释命令用途、风险、是否会删除或覆盖文件。
- 运行和发布前要有人审查,尤其涉及支付、隐私、权限、线上数据时。
推荐给新手的国内优先选择:
- 想快速做网页 Demo:先试 Trae、Qoder、豆包 MarsCode。
- 想在已有代码项目里改东西:先试 Qoder、Trae、通义灵码。
- 想在企业研发里长期使用:看通义灵码、百度 Comate、腾讯云 CodeBuddy、CodeGeeX。
- 想学编程:豆包 MarsCode、Trae、通义灵码都比纯聊天更容易上手。
图片、视频、音频工具
| 类型 | 海外工具 | 国内工具 | 能做什么 |
|---|---|---|---|
| 图片生成/编辑 | ChatGPT 图像、Gemini/Nano Banana、Midjourney、Adobe Firefly、Ideogram、Leonardo | 即梦、通义万相、豆包、可灵、Liblib、秒画 | 海报、插画、商品图、表情包、风格图、图片局部修改 |
| 视频生成 | Sora、Veo、Runway、Pika、Luma | 可灵、即梦、海螺、通义万相视频 | 文生视频、图生视频、广告分镜、短片概念 |
| 语音生成 | OpenAI Audio、ElevenLabs、Gemini Live/TTS | 豆包语音、讯飞、MiniMax、通义听悟 | 配音、播客、语音客服、会议转写 |
| 音乐生成 | Suno、Udio | 国内音乐生成工具和平台 | 歌曲 Demo、背景音乐、歌词改写 |
研究、搜索、知识库工具
| 工具 | 适合做什么 |
|---|---|
| Perplexity | 快速搜索并给来源,适合调研 |
| ChatGPT Deep Research / Gemini Deep Research / Kimi Deep Research | 让 AI 多步搜索、整理长报告 |
| NotebookLM | 把一堆资料变成可问答的知识库 |
| 飞书智能伙伴、钉钉 AI、企业微信 AI 能力 | 在组织内部处理文档、会议、知识库 |
| Dify、Coze、扣子、FastGPT | 搭建聊天机器人、客服、知识库、工作流 |
| LlamaIndex、LangChain | 开发者搭 RAG 和 Agent 的框架 |
常见专业名词大白话解释
基础概念
| 名词 | 大白话解释 |
|---|---|
| AI | 人工智能的总称。大模型只是 AI 的一类。 |
| 生成式 AI | 会"生成"文字、图片、音频、视频、代码的 AI。 |
| 大语言模型 LLM | 主要处理文字和代码的大模型。 |
| 多模态模型 | 不只看文字,还能看图、听音频、理解视频,甚至生成图片和声音。 |
| 基础模型 Foundation Model | 很大的通用底座模型,可以再包装成聊天、搜索、客服、编程等产品。 |
| 参数 | 模型内部的"记忆和计算旋钮"。参数多不一定体验好,只是模型规模指标之一。 |
| Token | 模型读写文字的最小计费/处理单位。中文大致可以理解为字、词、标点的切片。 |
| 上下文窗口 Context Window | 一次对话里模型能看见多少内容。窗口越大,越能读长文档和大代码库。 |
| 知识截止日期 Knowledge Cutoff | 模型训练资料大致到哪一天。之后发生的事,它可能不知道。 |
| 幻觉 Hallucination | AI 编出来但说得很像真的内容。 |
| Prompt 提示词 | 你给 AI 的任务说明。 |
| System Prompt 系统提示词 | 更高优先级的规则,比如"你要用中文回答""不能泄露隐私"。 |
| Temperature 温度 | 控制输出发散程度。低温更稳,高温更有创意但更可能跑偏。 |
| Reasoning 推理 | 模型花更多步骤思考复杂问题。通常更慢、更贵,但适合数学、代码、规划。 |
| Thinking Mode 思考模式 | 一些模型提供的"慢想"模式,用于复杂任务。 |
| Non-thinking Mode 非思考模式 | 快速回答模式,适合简单问答、改写、摘要。 |
模型能力相关
| 名词 | 大白话解释 |
|---|---|
| 指令遵循 | 你让它按格式、按规则做事,它听不听话。 |
| 长上下文 | 能不能读很长的文件、聊天记录、代码库。 |
| 工具调用 Tool Calling | 模型自己决定调用搜索、计算器、数据库、浏览器、函数等工具。 |
| Function Calling | 开发者给模型几个"按钮",模型判断该按哪个按钮并填参数。 |
| Agent 智能体 | 不只是回答,而是能计划、调用工具、执行多步任务的 AI。 |
| Multi-Agent 多智能体 | 多个 AI 分工合作,比如一个写代码、一个测试、一个审查。 |
| Computer Use 电脑操作 | AI 能看屏幕、点按钮、输入文字,像人一样操作软件。 |
| Browser Use 浏览器操作 | AI 能打开网页、搜索、点击、读取页面。 |
| Deep Research 深度研究 | AI 自动搜索多个来源,整理成较长报告。 |
| Multilingual 多语言 | 多种语言能力。中文、英文都好不代表所有语言都好。 |
| Vibe Coding | 用自然语言描述想法,让 AI 快速写出程序或网页原型。适合探索,但需要审查。 |
| Agentic Coding | AI 像工程助手一样读代码、拆任务、改文件、运行验证。比简单代码补全更主动。 |
数据和知识库相关
| 名词 | 大白话解释 |
|---|---|
| RAG | 让 AI 先从你的资料库里找相关内容,再基于资料回答。可减少胡编。 |
| Embedding 向量 | 把文字变成一串数字,用来判断两段话语义像不像。 |
| 向量数据库 | 存放 Embedding 的数据库,用于知识库搜索。 |
| Rerank 重排 | 先找出一批可能相关资料,再让模型重新排序,把最相关的放前面。 |
| Chunk 分块 | 把长文档切成小段,方便检索。 |
| OCR | 从图片或扫描件里识别文字。 |
| 结构化输出 | 让 AI 输出固定格式,比如表格、JSON、字段列表。 |
| JSON | 一种机器容易读取的数据格式,常用于让 AI 和软件系统对接。 |
| MCP | 一种让 AI 工具连接外部工具和数据源的协议,可以理解为"AI 插线板"。 |
训练和部署相关
非技术读者不必深学,但听懂即可。
| 名词 | 大白话解释 |
|---|---|
| 训练 Training | 用大量资料让模型学会语言、知识和规律。普通用户基本不会自己训练大模型。 |
| 预训练 Pre-training | 模型最早的大规模学习阶段,像读完整个图书馆。 |
| 后训练 Post-training | 让模型更会聊天、更安全、更听指令。 |
| 微调 Fine-tuning | 用少量特定数据让模型更适合某个行业或风格。 |
| 蒸馏 Distillation | 用大模型教小模型,让小模型便宜快速一些。 |
| 强化学习 RL | 用奖励信号训练模型,让它在某些任务上表现更好。 |
| MoE 混合专家 | 模型内部有很多"专家模块",每次只激活一部分,省算力。 |
| 开源模型 | 模型权重或代码开放,别人可以下载、部署、改造,具体权限看许可证。 |
| 闭源模型 | 只能通过官方产品或 API 使用,不能拿到模型本体。 |
| 本地部署 | 把模型跑在自己的电脑或服务器上,数据更可控,但需要硬件和运维。 |
| 私有化部署 | 企业把模型部署到自己的云或机房,便于合规和数据安全。 |
| 推理 Inference | 模型已经训练好之后,用户提问、模型回答的过程。 |
| 延迟 Latency | 从你发出问题到模型开始/完成回答的等待时间。 |
| 吞吐 Throughput | 同一时间能处理多少请求。 |
| 量化 Quantization | 把模型压缩,让它更省显存、更容易部署,但可能略降效果。 |
安全和合规相关
| 名词 | 大白话解释 |
|---|---|
| 隐私 | 个人信息、聊天内容、上传文件是否会被保存或用于训练。 |
| 数据隔离 | 企业数据不会和其他客户混在一起。 |
| Prompt Injection 提示词注入 | 恶意网页或文件诱导 AI 忽略原规则、泄露信息或执行危险操作。 |
| 越狱 Jailbreak | 诱导 AI 绕过安全规则。 |
| Guardrails 护栏 | 限制 AI 输出和行为的安全规则。 |
| Red Team 红队测试 | 专门找 AI 安全漏洞的测试。 |
| 水印 | 给 AI 生成内容加可识别标记。 |
| 版权风险 | AI 生成内容可能和已有作品相似,商业使用需谨慎。 |
普通人怎么选工具
如果你是学生
- 查资料:Perplexity、Kimi、Gemini、ChatGPT。
- 读论文:Kimi、Claude、NotebookLM、ChatGPT。
- 写作业:让 AI 解释、列提纲、检查逻辑,不要直接照抄。
- 学语言:ChatGPT、Claude、Gemini、豆包。
推荐工作流:
text
我在学习[主题],我是零基础。
请先用 5 岁小孩能懂的比喻解释,再用大学课堂能接受的方式解释。
最后给我 5 道练习题,并在我回答后批改。
如果你是产品经理
- 写 PRD:ChatGPT、Claude、Kimi、通义。
- 竞品分析:Perplexity、Kimi Deep Research、ChatGPT 搜索。
- 原型 Demo:Codex、Cursor、Trae、Qoder。
- 用户反馈整理:ChatGPT、Claude、Kimi。
推荐工作流:
text
你是资深产品经理。
我要做一个[产品/功能]。
目标用户是[用户],核心痛点是[痛点]。
请输出:用户故事、核心流程、页面结构、关键字段、边界情况、验收标准。
不要写空话,用表格整理。
如果你是运营/市场/内容
- 活动方案:ChatGPT、Claude、豆包、通义。
- 选题和标题:ChatGPT、豆包、Kimi。
- 数据复盘:ChatGPT、Claude、Excel Copilot。
- 海报和短视频:即梦、可灵、Midjourney、Runway、海螺。
推荐工作流:
text
你是增长运营。
我要为[产品]做[活动],目标是[拉新/转化/复购]。
预算是[金额],周期是[时间],渠道是[渠道]。
请给出 3 套方案,每套包含:核心创意、用户路径、物料清单、风险、数据指标。
如果你是设计师
- 灵感探索:Midjourney、即梦、通义万相、ChatGPT 图像。
- 图片修改:Gemini/Nano Banana、ChatGPT 图像、Adobe Firefly。
- 文案和信息架构:Claude、ChatGPT、Kimi。
- 前端还原:Cursor、Codex、Trae。
推荐工作流:
text
请把这个页面截图拆解成设计说明:
1. 信息层级
2. 组件清单
3. 色彩和字体风格
4. 交互状态
5. 可以优化的地方
输出给产品和前端都能看懂。
如果你是管理者
- 战略草案:ChatGPT、Claude。
- 会议纪要:通义听悟、飞书妙记、腾讯会议 AI、Zoom AI。
- 周报/月报:ChatGPT、Kimi、Claude。
- 团队知识库:NotebookLM、Dify、Coze、企业内部 AI 平台。
推荐工作流:
text
你是我的管理顾问。
下面是团队本周进展和问题。
请帮我整理成:关键进展、风险、需要我决策的事项、下周优先级。
请直接、克制,不要写官话。
如果你想做一个小工具或网页
不懂代码也可以尝试:
- 先让 AI 帮你写需求。
- 再让 Codex/Cursor/Trae/Qoder 生成页面。
- 让它解释怎么运行。
- 自己点击试用,把问题截图发回去让它修。
- 真要上线前找懂技术的人审查。
推荐工作流:
text
我不懂编程。
我想做一个网页工具:[描述功能]。
用户打开后可以:[列出 3-5 个动作]。
请先帮我写一份简短需求文档,再拆成实现步骤。
不要马上写代码,先让我确认。
提问技巧:从"问答"升级到"协作"
低质量提问
text
帮我写个方案。
问题:没有背景、没有目标、没有读者、没有格式。
高质量提问
text
你是资深品牌营销顾问。
我要给一家新茶饮品牌写一份七夕活动方案。
目标用户:一二线城市 20-30 岁女性。
目标:提升小程序下单和社交传播。
限制:预算 20 万,周期 2 周,不能涉及抽奖合规风险。
请输出 3 套方案,每套包含主题、用户路径、传播文案、物料、预算拆分、风险。
最后给出你最推荐的一套,并说明理由。
万能提示词模板
text
角色:你是[角色]。
目标:我要[完成什么]。
背景:[已有信息]。
受众:[给谁看/谁使用]。
限制:[时间、预算、字数、风格、不能做什么]。
输出:[格式和结构]。
质量要求:[要具体、可执行、不要空话、给例子]。
互动方式:如果信息不够,先问我最多 3 个关键问题。
让 AI 更可靠的 8 个句式
- "先列出你的假设,再给结论。"
- "如果你不确定,请明确说不确定,不要编。"
- "请给出处或告诉我应该核查哪些来源。"
- "请把事实、推测、建议分开写。"
- "请用表格比较优缺点。"
- "请站在反方视角挑错。"
- "请给我一个最小可行版本。"
- "请把结果改成普通人能听懂的大白话。"
AI 工作流示例
示例 1:读一份 80 页报告
text
我会分批上传一份报告。
请你每次只做三件事:
1. 用 200 字总结本批内容
2. 提取关键数据和结论
3. 记录后面可能需要交叉验证的问题
等我说"全部上传完毕"后,再输出完整报告摘要。
示例 2:做竞品调研
text
请帮我调研[行业]的 5 个主要竞品。
输出表格:产品定位、核心用户、收费方式、核心功能、优势、短板、可借鉴点。
请优先引用官网、帮助中心、公开新闻和应用商店信息。
不确定的地方标注"待核查"。
示例 3:把想法变成网页 Demo
text
请根据下面需求生成一个可运行的前端 Demo:
[需求]
要求:
1. 第一屏就是可用功能,不要做营销落地页
2. 使用假数据
3. 界面要适合真实产品演示
4. 先给页面结构和组件清单,我确认后再实现
示例 4:让 AI 帮你学习一个新领域
text
我想入门[领域]。
请给我一条 14 天学习路线。
每天包含:学习目标、阅读材料类型、练习任务、检验标准。
我每天只有 45 分钟。
请避免推荐过多资料,优先少而精。
使用 AI 的底线
不能直接上传的内容
- 身份证、护照、银行卡、手机号等个人敏感信息。
- 未公开合同、报价单、客户名单、源代码、财务数据。
- 公司内部战略、未发布产品计划、投放数据。
- 医疗记录、法律案件材料、未授权的学生信息。
如果必须用 AI 处理,请先脱敏:
- 把姓名换成 A/B/C。
- 把手机号、身份证、地址删掉。
- 把金额改成区间。
- 用企业批准的 AI 工具,而不是个人账号随便上传。
哪些结论一定要人工复核
- 法律、医学、财务、投资、税务。
- 重大商业决策。
- 涉及个人权益、劳动关系、合同义务。
- 新闻事实、引用来源、历史事件、统计数据。
- AI 生成代码中的安全、权限、支付、隐私逻辑。
如何减少幻觉
- 让 AI 引用来源。
- 给它你自己的资料,而不是只凭空问。
- 让它标注"不确定"和"待核查"。
- 对关键事实用搜索引擎、官网、数据库再查一遍。
- 多问一个模型交叉验证,但不要以为"两个 AI 都这么说"就一定对。
一页速查:不同任务选什么
| 任务 | 首选工具 |
|---|---|
| 日常问答 | ChatGPT、Claude、Gemini、豆包、通义、Kimi |
| 中文长文档 | Kimi、Claude、ChatGPT、通义、文小言 |
| 搜索调研 | Perplexity、Kimi Deep Research、ChatGPT 搜索、Gemini |
| 写方案 | Claude、ChatGPT、Kimi、通义 |
| 做 PPT | Kimi Slides、Gamma、Tome、Canva、通义、豆包 |
| 做表格分析 | ChatGPT、Claude、Excel Copilot、Kimi Sheets |
| 画图 | Midjourney、ChatGPT 图像、Gemini/Nano Banana、即梦、通义万相 |
| 做视频 | Sora、Veo、Runway、可灵、即梦、海螺 |
| 语音转文字 | 通义听悟、飞书妙记、腾讯会议 AI、Whisper 类工具 |
| 写代码 | Codex、Cursor、Claude Code、Qoder、Trae、GitHub Copilot |
| 搭知识库 | NotebookLM、Dify、Coze、FastGPT、企业内部 AI 平台 |
| 企业模型调用 | OpenAI API、Claude API、Gemini API、阿里云百炼、百度千帆、火山方舟、腾讯云混元、AWS Bedrock、Azure AI Foundry、Vertex AI |
30 天入门路线
第 1 周:会问
- 每天用 AI 做一个真实小任务,比如改邮件、总结文章、列计划。
- 练习把"随便问"改成"角色 + 目标 + 背景 + 输出格式"。
- 学会让 AI 解释术语、举例、反驳自己。
第 2 周:会查
- 用 Perplexity、Kimi、ChatGPT 搜索做一次资料调研。
- 学会区分官网、新闻、论坛、广告软文。
- 每次报告都让 AI 标注事实、推测、建议。
第 3 周:会做
- 用 AI 做一份完整产物:PPT、活动方案、课程大纲、调研表格、小网页。
- 尝试一个 AI 编程工具,哪怕只是做一个静态网页。
- 学会截图反馈:"这里太挤""按钮没反应""改成表格"。
第 4 周:会控风险
- 学会脱敏资料。
- 学会核查来源。
- 学会让 AI 先出计划,再执行。
- 建立自己的提示词模板库。
初学者最容易踩的坑
- 以为 AI 回答流畅就一定正确。
- 把内部资料直接上传到个人 AI 账号。
- 问题太短,却期待专业结果。
- 只用一个工具,不知道不同工具擅长不同任务。
- 让 AI 一次完成过大的任务,结果失控。
- 不会保存好提示词、资料和产出过程。
- 过度追逐模型版本,而忽略工作流。
- 把 AI 当搜索引擎,但不要求来源。
- 把 AI 当同事,但不给背景和标准。
- 把 AI 当权威,而不是当助手。
AI 工具实战:让 AI 处理 Word、CSV、PDF、PPT 和网页
这一部分不是讲原理,而是讲普通人最常见的文件和工作任务应该怎么交给 AI。核心原则很简单:先说清楚你要什么结果,再上传文件或粘贴内容,最后让 AI 按固定格式输出。
实战前的通用步骤
不管你处理 Word、Excel、PDF 还是网页,都建议按这 5 步来:
- 先说明你的身份和目标:比如"我是运营,我要做一份复盘"。
- 再说明文件是什么:比如"这是过去 3 个月销售明细 CSV"。
- 明确输出格式:比如"请输出表格、结论、风险、下一步动作"。
- 要求它标注不确定内容:比如"无法从文件判断的地方写待确认"。
- 最后让它二次检查:比如"请检查有没有遗漏、计算错误或逻辑跳跃"。
国内工具组合可以这样选:
| 场景 | 新手优先组合 |
|---|---|
| 读长文档和 PDF | Kimi + 通义 + 腾讯元宝 |
| 写材料和改 Word | WPS AI + Kimi + 通义 |
| 做 PPT | Kimi Slides + WPS AI + Gamma/Canva |
| 分析 CSV/Excel | Kimi Sheets + WPS AI + ChatGPT/Claude 作为补充 |
| 搜索调研 | Kimi Deep Research + 文小言 + 通义 |
| 会议纪要 | 飞书妙记 + 通义听悟 + 腾讯会议 AI |
| 图片视频 | 豆包 + 即梦 + 可灵 + 通义万相 + 海螺 |
| 做网页 Demo 和自动化 | Trae + Qoder + 豆包 MarsCode + 通义灵码 |
| 搭知识库和机器人 | 扣子/Coze + Dify + FastGPT + 飞书知识问答 |
通用提示词:
text
我会上传/粘贴一份[文件类型]。
我的目标是[你要完成的事]。
请你先判断文件里有哪些信息,再按以下结构输出:
1. 文件内容概览
2. 关键发现
3. 可执行建议
4. 风险和待确认问题
5. 下一步我应该怎么做
请不要编造文件中没有的信息。
Word 文档:改稿、总结、提炼、重写
常见任务:
- 把长文档总结成 1 页。
- 把会议纪要整理成行动项。
- 把口语化内容改成正式方案。
- 把合同、制度、公告改成更容易理解的版本。
- 检查逻辑、语气、错别字、结构是否清楚。
推荐工具:
- Kimi、通义、文小言、腾讯元宝、WPS AI、飞书智能伙伴。
- ChatGPT、Claude 可作为海外补充,尤其适合长文改写和多轮审稿。
- 如果文档很长,优先用 Kimi、通义、腾讯元宝这类长文档能力较强的工具,Claude、ChatGPT 可补充交叉检查。
- 如果主要在 WPS 里办公,WPS AI 更顺手;如果在 Microsoft Office 生态里,Microsoft Copilot 更适合直接配合 Word。
提示词示例 1:把 Word 总结成汇报版
text
这是一个 Word 文档,内容比较长。
请帮我整理成给领导看的 1 页汇报,要求:
1. 先用 100 字说明这份文档讲什么
2. 提炼 5 个最重要结论
3. 列出 3 个风险
4. 列出需要领导决策的事项
5. 语气正式、直接,不要空话
如果文档里没有依据,请标注"文档未说明"。
提示词示例 2:把会议纪要变成行动清单
text
请把这份会议纪要整理成行动清单。
输出表格字段:
事项、负责人、截止时间、依赖条件、风险、当前状态。
如果负责人或截止时间没有写,请填"待确认"。
最后单独列出所有需要追问的问题。
提示词示例 3:检查文档质量
text
请以资深编辑的角度审阅这份文档。
重点检查:
1. 结构是否清楚
2. 有没有重复内容
3. 有没有逻辑跳跃
4. 有没有表达含糊的句子
5. 哪些段落可以删减
请按"问题位置、问题说明、修改建议、示例改写"输出。
注意事项:
- 合同、法律文件不要只听 AI 结论,必须找专业人士复核。
- 公司内部文档上传前要确认是否允许,必要时先脱敏。
- 如果 AI 直接重写整篇,最好要求它"先列修改建议,再改写",避免改丢重点。
CSV / Excel:分析数据、找异常、做透视、写结论
CSV 可以理解为"纯文本版表格",Excel 是更完整的表格文件。AI 很适合帮你看数据,但你要让它把计算过程讲清楚。
常见任务:
- 清洗数据:去重、统一字段、补全分类。
- 汇总数据:按月份、渠道、城市、商品、用户类型分组。
- 找异常:突然上涨、突然下降、缺失值、重复记录。
- 生成图表建议:折线图、柱状图、饼图、漏斗图。
- 写业务解读:把数字变成领导能看懂的结论。
推荐工具:
- Kimi Sheets、WPS AI、通义、飞书表格 AI、腾讯文档 AI。
- ChatGPT、Claude、Excel Copilot、Google Sheets + Gemini 可作为补充。
- 大数据量或复杂计算,建议让 AI 写公式、SQL 或 Python 脚本,再由人验证。
- 非技术用户优先用 Kimi Sheets、WPS AI、飞书表格 AI、腾讯文档 AI 这类更贴近表格的软件。
提示词示例 1:快速读懂 CSV
text
这是一个 CSV 文件。
请先帮我理解数据结构:
1. 每一列是什么意思
2. 哪些列适合做维度
3. 哪些列适合做指标
4. 数据里可能有哪些质量问题
5. 建议我做哪些分析
先不要急着下结论,先给分析计划。
提示词示例 2:做运营复盘
text
请基于这份表格做运营复盘。
重点分析:
1. 总体趋势
2. 表现最好的渠道/城市/商品
3. 下滑最明显的部分
4. 可能原因
5. 下个月建议动作
请输出给业务负责人看的版本,不要只堆数字。
涉及计算的地方,请说明你用了哪些字段。
提示词示例 3:生成 Excel 公式
text
我在 Excel 里有这些列:[列名列表]。
我想实现:[目标,例如按用户 ID 去重后统计每个城市的订单数]。
请给我可直接复制的 Excel 公式。
同时解释公式每一段是什么意思。
如果需要数据透视表,请告诉我具体拖哪些字段到行、列、值、筛选。
提示词示例 4:让 AI 写 SQL
text
这是数据表字段:
[字段列表]
我想分析:[分析目标]
请帮我写 SQL,并解释:
1. 每个字段的用途
2. WHERE 条件为什么这样写
3. GROUP BY 按什么维度聚合
4. 结果应该如何解读
注意事项:
- AI 可能算错数,关键报表要用 Excel、数据库或脚本复核。
- 上传表格前删除手机号、身份证、地址、客户姓名等敏感列。
- 数据口径一定要说清楚,比如"订单金额是否含退款""新增用户按注册还是首单计算"。
PDF:读报告、论文、合同、扫描件
PDF 的难点是格式复杂,有些是可复制文字,有些只是扫描图片。AI 能读 PDF,但遇到扫描件、复杂表格、页眉页脚时可能漏读。
常见任务:
- 总结行业报告。
- 提取关键数据和图表结论。
- 对比多份报告观点。
- 读论文并解释成大白话。
- 从合同里找风险条款。
推荐工具:
- Kimi、通义、文小言、腾讯元宝、WPS AI。
- Claude、ChatGPT、Gemini、NotebookLM 可作为海外补充。
- 多篇资料一起研究,可以优先用 Kimi Deep Research、通义、腾讯元宝,NotebookLM 和 ChatGPT Deep Research 可作为补充。
提示词示例 1:读行业报告
text
请阅读这份 PDF 行业报告。
输出:
1. 这份报告的核心观点
2. 5 个最重要数据
3. 报告支持这些观点的证据
4. 对我们业务可能有用的机会
5. 报告里不够确定或需要二次核查的地方
请尽量标注页码。
提示词示例 2:读论文
text
请把这篇论文解释给非技术背景的人。
按以下结构输出:
1. 研究问题是什么
2. 作者用了什么方法,用大白话解释
3. 主要发现是什么
4. 这篇论文有什么局限
5. 如果我要继续了解,需要补哪些背景知识
不要堆专业术语。
提示词示例 3:读合同风险
text
请从业务风险角度阅读这份合同。
重点找:
1. 付款和退款条款
2. 违约责任
3. 自动续约
4. 排他或限制条款
5. 数据、隐私、保密条款
请输出风险清单,但不要给最终法律意见。
需要律师确认的地方请标注。
注意事项:
- 扫描 PDF 如果识别效果差,先用 OCR 工具转文字。
- 合同、财报、招股书这类高风险材料必须人工复核。
- 让 AI 标注页码和原文依据,方便你回到 PDF 检查。
PPT:生成大纲、改结构、写演讲稿
AI 做 PPT 最有价值的地方,不是自动生成漂亮页面,而是先帮你把逻辑理顺。
常见任务:
- 把一堆资料变成 PPT 大纲。
- 把 Word/报告改成汇报页。
- 给每页写标题、要点、讲稿。
- 检查 PPT 逻辑是否顺。
- 根据听众改语气,比如给老板、客户、同事。
推荐工具:
- Kimi Slides、WPS AI、通义、豆包、腾讯文档 AI。
- Gamma、Tome、Canva、Microsoft Copilot、ChatGPT 可作为补充。
- 正式商务汇报建议先让 AI 出大纲,再人工设计版式。
提示词示例 1:从资料生成 PPT 大纲
text
请把下面资料整理成一份 12 页 PPT 大纲。
听众是[老板/客户/同事],目标是[说服/汇报/培训/复盘]。
每页输出:
页码、页面标题、核心观点、3 个要点、建议图表、演讲备注。
要求逻辑清楚,不要堆材料。
提示词示例 2:优化已有 PPT
text
请审阅这份 PPT 的逻辑。
重点判断:
1. 首页是否讲清楚目标
2. 每页标题是否是结论句
3. 页面顺序是否自然
4. 有没有重复或可以删掉的页
5. 最后一页行动建议是否明确
请输出修改建议和新的目录结构。
提示词示例 3:写演讲稿
text
请根据这份 PPT 写一版 8 分钟演讲稿。
要求:
1. 每页 30-60 秒
2. 语言自然,不要像念稿
3. 关键数据要解释含义
4. 转场要顺
5. 最后有明确结论和请求
注意事项:
- AI 生成的 PPT 常常"看起来有内容但重点不突出",一定要检查每页是否只有一个核心观点。
- 正式对外材料要核查图片版权、数据来源、品牌规范。
- 不要一开始就让 AI "做一份漂亮 PPT",先让它做结构。
图片和截图:识别、解释、改图、生成物料
AI 现在可以看图,也可以生成图。普通人最实用的不是炫技,而是让它读截图、拆页面、改海报、生成素材。
常见任务:
- 解释一张截图里有什么。
- 从海报里提取文案和布局。
- 分析一个页面的设计问题。
- 根据产品信息生成海报创意。
- 修改图片中的局部内容。
推荐工具:
- ChatGPT 图像、Gemini、Claude、豆包、即梦、通义万相、Midjourney、Adobe Firefly。
提示词示例 1:分析截图
text
请分析这张页面截图。
输出:
1. 页面主要功能
2. 信息层级
3. 用户最可能先看到什么
4. 交互上可能有什么问题
5. 如果要优化,给 5 条具体建议
提示词示例 2:生成海报创意
text
我要做一张[活动/产品]海报。
目标用户是[人群],风格是[高级/年轻/专业/温暖]。
请给我 5 个创意方向,每个包含:
主标题、副标题、画面元素、色彩建议、适合渠道。
不要直接生成图,先给创意方案。
提示词示例 3:改图
text
请基于这张图片做修改:
1. 保留主体和构图
2. 把背景改成[描述]
3. 去掉[不需要的元素]
4. 整体风格保持[风格]
5. 不要改变品牌 Logo 和文字内容
注意事项:
- 商业使用图片要注意版权和肖像权。
- AI 改图可能改坏文字和 Logo,重要物料要人工复核。
- 涉及真实人物时,不要做误导性、冒充性或侵犯隐私的内容。
网页和链接:搜索、对比、提炼信息
网页任务最适合让 AI 做"资料收集和初步判断",但必须看来源。
常见任务:
- 对比几个产品官网。
- 总结新闻和政策。
- 找竞品价格、功能、更新记录。
- 把多个网页整理成表格。
- 生成调研报告。
推荐工具:
- Kimi Deep Research、文小言、通义、腾讯元宝、夸克 AI、秘塔 AI 搜索。
- Perplexity、ChatGPT 搜索、Gemini、NotebookLM 可作为海外补充。
提示词示例 1:网页对比
text
请对比以下 5 个网页中的产品:
[链接列表]
输出表格:
产品、定位、核心功能、价格、目标用户、亮点、短板、来源链接。
请只基于网页内容,不要编造。
无法确认的地方写"未找到"。
提示词示例 2:政策/新闻总结
text
请总结这些网页内容。
要求:
1. 按时间线整理
2. 区分事实、解读、影响
3. 标注每条信息来自哪个链接
4. 最后给出我需要继续核查的问题
注意事项:
- 不要只看 AI 的总结,关键内容要点回原网页确认。
- 搜索结果可能混入广告、旧文章、转载文章。
- 政策、法规、价格、版本信息都要看发布日期。
邮件、聊天记录和会议纪要:提炼关系和行动项
很多人每天最耗时间的不是写文章,而是处理一堆沟通信息。AI 很适合把混乱对话整理成"谁要做什么"。
常见任务:
- 把微信群/飞书群讨论整理成结论。
- 从邮件往来里提取争议点。
- 生成跟进邮件。
- 把会议录音转写稿变成纪要。
推荐工具:
- 飞书妙记、通义听悟、腾讯会议 AI、Kimi、通义、腾讯元宝。
- ChatGPT、Claude、Microsoft Copilot 可作为补充。
提示词示例:
text
下面是一段聊天/会议记录。
请整理成:
1. 已达成共识
2. 未解决分歧
3. 行动项表格:事项、负责人、截止时间、依赖、风险
4. 需要我发送的跟进消息草稿
不要美化原意,不确定就写待确认。
注意事项:
- 聊天记录可能涉及他人隐私,上传前先确认权限。
- AI 总结可能误判语气和责任归属,发出前要人工检查。
代码、网页和自动化:让 AI 做"万能执行助手"
非程序员不需要一上来学复杂工程,但可以让 AI 帮你做很多小工具。更准确地说,编码工具不是"程序员专用",而是"能操作文件和项目的 AI 助手"。只要任务能被拆成文件、数据、网页、脚本、表格、目录结构,它通常都能帮上忙。
常见任务:
- 做一个静态网页或产品 Demo。
- 批量重命名文件。
- 把一堆文本转成表格。
- 写一个自动整理 CSV 的脚本。
- 帮你解释报错。
- 把 Word/PDF 里的需求整理成 Markdown。
- 把 Markdown 文档生成目录、FAQ、培训材料。
- 把一堆图片、音频、资料按规则归档。
- 把重复性的浏览器操作整理成流程说明或自动化脚本。
推荐工具:
- 国内优先:Trae、Qoder、通义灵码、豆包 MarsCode、百度 Comate、腾讯云 CodeBuddy、CodeGeeX。
- 海外补充:Codex、Cursor、Claude Code、GitHub Copilot、Replit Agent、Gemini CLI。
怎么理解这些工具:
- Trae / Qoder 更像"能做项目的 AI 工作台",适合从需求到 Demo、从文档到实现。
- 通义灵码 / Comate / CodeBuddy / CodeGeeX 更像"嵌在开发环境里的 AI 同事",适合团队研发、读代码、改代码。
- MarsCode / Replit Agent 更像"在线开发环境",适合学习和快速做小应用。
- Codex / Cursor / Claude Code 是海外代表,工程能力强,适合复杂代码库和自动化任务。
提示词示例 1:做网页 Demo
text
我不懂编程,但想做一个网页 Demo。
功能是:[描述功能]
页面包括:[页面/模块]
交互包括:[点击、筛选、上传、导出等]
请先输出需求文档和页面结构,不要马上写代码。
我确认后,再一步一步实现。
提示词示例 1.5:把文档变成可演示 Demo
text
我会给你一份 Word/PDF/Markdown 需求文档。
请先提取:
1. 目标用户
2. 核心场景
3. 页面列表
4. 每个页面的关键组件
5. 需要的假数据
然后做一个最小可演示版本。
要求第一屏就是可用功能,不要做营销介绍页。
提示词示例 2:批量处理文件
text
我有一批文件,需要批量处理:
当前格式:[说明]
目标格式:[说明]
限制:[不能覆盖原文件/需要保留备份/只处理某类文件]
请先给我处理方案和风险点。
如果要写脚本,请解释我应该如何运行,以及如何验证结果。
提示词示例 3:解释报错
text
这是我看到的报错:
[粘贴报错]
请用非程序员能听懂的话解释:
1. 大概哪里出了问题
2. 可能原因有哪些
3. 我应该先检查什么
4. 如果要请开发帮忙,我该怎么描述这个问题
提示词示例 4:把 CSV 自动生成报告
text
请帮我做一个小工具:
输入是一份 CSV,字段包括:[字段列表]
输出是一份 Markdown 报告,包含:
1. 总览指标
2. 分组统计
3. 异常数据
4. 业务建议
请先生成处理方案,不要直接写代码。
确认后再实现,并保留原始 CSV 不要覆盖。
注意事项:
- 让 AI 改代码前,最好备份或使用 Git。
- 不懂代码时,不要运行你看不懂的危险命令,尤其是删除、覆盖、上传、授权相关命令。
- 涉及线上系统、客户数据、支付、权限时,必须找开发人员审查。
- 让它先"只读检查"和"展示计划",再允许它改文件。
- 批量处理文件前,要求它先用 2-3 个样例演示结果。
知识库和资料库:把一堆文件变成可问答助手
如果你有很多制度、FAQ、产品文档、培训材料,可以用 AI 知识库工具,让它基于这些资料回答问题。
常见任务:
- 公司制度问答。
- 客服 FAQ。
- 产品帮助中心。
- 销售话术库。
- 课程资料助手。
推荐工具:
- NotebookLM、Dify、Coze/扣子、FastGPT、飞书知识问答、企业内部 AI 平台。
提示词示例:
text
我想把这些资料做成一个知识库助手。
目标用户是:[用户]
资料包括:[资料类型]
助手应该能回答:[问题类型]
不能回答:[边界]
请帮我设计:
1. 资料分类方式
2. 用户常问问题
3. 回答格式
4. 无法回答时的兜底话术
5. 后续维护方法
注意事项:
- 知识库质量取决于原资料质量,资料混乱时 AI 也会混乱。
- 要定期删除过期资料,标注版本和发布日期。
- 企业知识库要配置权限,不是所有资料都应该给所有人看。
文件处理任务速查表
| 文件/资料类型 | 常见任务 | 推荐工具 | 最重要的提醒 |
|---|---|---|---|
| Word | 总结、改写、提炼行动项、审稿 | Kimi、通义、WPS AI、腾讯元宝、文小言 | 重要文档先脱敏,法律合同要人工复核 |
| CSV/Excel | 统计、分组、找异常、写复盘 | Kimi Sheets、WPS AI、飞书表格 AI、通义 | 关键数字一定要复算 |
| 读报告、读论文、找风险条款 | Kimi、通义、腾讯元宝、文小言、WPS AI | 要求标注页码和来源 | |
| PPT | 生成大纲、优化结构、写讲稿 | Kimi Slides、WPS AI、通义、豆包、腾讯文档 AI | 先做逻辑,再做美化 |
| 图片/截图 | 看图、拆解页面、生成素材、改图 | 豆包、即梦、通义万相、可灵、海螺 | 注意版权、肖像权、Logo 和文字准确性 |
| 网页链接 | 搜索、竞品分析、政策总结 | Kimi Deep Research、文小言、通义、秘塔 AI 搜索 | 看发布日期和原始来源 |
| 聊天/会议记录 | 总结共识、分歧、行动项 | 飞书妙记、通义听悟、腾讯会议 AI、Kimi、通义 | 发出前核对责任人和语气 |
| 代码/文件夹 | 做 Demo、改脚本、批量处理 | Trae、Qoder、通义灵码、豆包 MarsCode、CodeGeeX | 不懂的危险命令不要运行 |
| 多份资料 | 搭知识库、做问答助手 | 扣子/Coze、Dify、FastGPT、飞书知识问答、NotebookLM | 资料要分组、去重、标版本 |
最推荐的新手练习顺序
- 先用 AI 总结一篇文章或 Word 文档。
- 再让 AI 把一份会议纪要变成行动项表格。
- 再上传一个 CSV,让 AI 做一次简单复盘。
- 再上传一个 PDF 报告,让 AI 提炼数据和页码。
- 再让 AI 根据资料生成 PPT 大纲。
- 最后尝试用 Trae、Qoder、豆包 MarsCode 或通义灵码做一个小网页。
练习时记住:不要追求一次完美。把 AI 当成一个需要你反复说明背景、纠正方向、检查结果的实习助手,会更接近真实使用方式。
最后记住这 10 句话
- AI 是助手,不是负责人。
- 你给的信息越清楚,它越有用。
- 复杂任务先让 AI 出计划,再执行。
- 关键事实必须核查。
- 不要上传无权上传的敏感资料。
- 不要死记模型版本,要理解工具适合什么任务。
- 写作、阅读、翻译、总结、代码、图片、视频都已有成熟工具。
- "会用 AI"的核心是会拆任务、会给上下文、会验收结果。
- 不懂技术也可以用 AI 做很多事,但上线和合规要找专业人士。
- 最好的入门方式不是看完所有教程,而是每天拿一个真实任务练。
资料来源与继续查看
模型和工具更新很快,建议优先看官方页面: