文章目录
- 一、传统大模型和智能体
-
- [1. 传统大模型](#1. 传统大模型)
-
- [1.1 定义](#1.1 定义)
- [1.2 作用与功能](#1.2 作用与功能)
- [1.3 应用场景](#1.3 应用场景)
- [2. 智能体(AI Agent)](#2. 智能体(AI Agent))
-
- [2.1 定义](#2.1 定义)
- [2.2 作用与功能](#2.2 作用与功能)
- [2.3 应用场景](#2.3 应用场景)
- 二、智能体开发平台
-
- [1. Coze(扣子)](#1. Coze(扣子))
-
- [1.1 定义](#1.1 定义)
- [1.2 作用与功能](#1.2 作用与功能)
- [1.3 应用场景](#1.3 应用场景)
- [2. Dify](#2. Dify)
-
- [2.1 定义](#2.1 定义)
- [2.2 作用与功能](#2.2 作用与功能)
- [2.3 应用场景](#2.3 应用场景)
- 三、Dify下载与安装
-
- [1. 下载dify](#1. 下载dify)
- [2. 解压 Dify 源码包](#2. 解压 Dify 源码包)
- [3. 配置 Dify 环境变量](#3. 配置 Dify 环境变量)
- [4. 启动 Dify 服务](#4. 启动 Dify 服务)
- [5. 浏览器访问 Dify 并初始化](#5. 浏览器访问 Dify 并初始化)
一、传统大模型和智能体
1. 传统大模型
1.1 定义
传统大模型(Large Language Model, LLM / 多模态大模型),是指基于Transformer架构 、参数规模达数十亿至万亿级别 、通过海量互联网文本/图像/音视频数据预训练而成的深度学习系统。其核心是通过统计学习捕获人类知识、语言规律与模式,具备强大的通用理解、生成与泛化能力,但本质上是被动响应式的"静态大脑",缺乏自主感知、规划与执行能力。
1.2 作用与功能
- 自然语言理解:语义解析、意图识别、情感分析、多轮对话上下文记忆。
- 内容生成创作:文本撰写、代码生成、翻译、摘要、文案/剧本/诗歌创作。
- 知识问答与推理:常识问答、逻辑推理、数学计算、知识科普与解释。
- 多模态处理:图像理解、图文生成、语音转写、跨模态信息融合(GPT-4V、文心一言等)。
- 少样本/零样本学习:无需大量标注数据,即可快速适配新任务,具备强泛化性。
1.3 应用场景
- 日常消费:智能助手(ChatGPT、豆包、文心一言)、内容创作、娱乐互动、语言学习。
- 企业办公:智能客服、文档总结、邮件生成、会议纪要、报表自动化。
- 软件开发:代码补全(GitHub Copilot)、bug解释、测试用例生成、技术文档撰写。
- 行业赋能:医疗辅助诊断、金融风险评估、法律文书审查、教育个性化辅导。
- 内容媒体:新闻生成、广告文案、舆情分析、短视频脚本创作。
2. 智能体(AI Agent)
2.1 定义
AI智能体(AI Agent)是以大模型为核心大脑 ,整合感知、记忆、规划、决策、工具调用、行动执行 六大模块,具备自主性、目标导向、环境交互与持续学习 能力的智能系统。它突破传统大模型"被动应答"局限,能自主理解目标、拆解任务、调用工具、动态调整、闭环完成复杂工作,是"能思考、会规划、可行动"的主动式AI实体。
2.2 作用与功能
- 自主感知与理解:多模态输入(文本/语音/图像/数据)、环境状态感知、长期记忆与用户偏好学习。
- 目标驱动规划:复杂任务自动拆解、子任务排序、执行路径决策、异常情况自适应调整。
- 工具链调用:联网搜索、数据库读写、API调用、文件操作、代码执行、第三方服务集成。
- 自主行动执行:无需人工逐步干预,闭环完成全流程任务(如订机票、写报告、数据分析)。
- 反思与迭代:结果校验、错误修正、经验沉淀、持续优化执行策略。
2.3 应用场景
- 个人助理:行程规划、理财管理、学习辅导、生活服务自动化、长期任务跟进。
- 企业运营:智能客服(主动解决问题)、流程自动化(审批/订单/报表)、市场调研、竞品分析。
- 软件开发:自主编程Agent(Claude Code、Codex)、项目维护、bug自动修复、系统部署。
- 办公自动化:文档批量处理、数据汇总分析、PPT/Excel自动生成、合同审核与起草。
- 行业垂直:金融投研、医疗随访、工业运维、自动驾驶、智能家居中枢、数字人交互。
二、智能体开发平台
1. Coze(扣子)
1.1 定义
Coze(扣子)是字节跳动 推出的一站式零代码/低代码AI智能体开发平台 ,定位为"人人可用的AI应用构建工具"。以易用性、生态整合、快速落地为核心,通过可视化编排、插件生态与大模型能力封装,让非技术人员快速创建可对话、可联网、可执行任务的智能体,并支持多渠道一键发布。
1.2 作用与功能
- 零代码可视化开发:自然语言描述生成Agent、拖拽式工作流编排、无需编程基础。
- 大模型底座:原生支持豆包系列大模型,兼容DeepSeek、Llama等第三方模型。
- 超丰富插件生态:10000+官方/第三方插件,覆盖搜索、数据分析、图像、语音、办公、数据库等。
- 企业级RAG知识库:支持20+格式文档上传、自动切片向量化、混合检索、引用溯源、增量更新。
- 长期记忆系统:持久化存储用户偏好、项目规则、历史交互,实现个性化与一致性服务。
- 多端一键发布:支持抖音、微信、飞书、Discord、Web、企业APP等10+渠道部署。
- 主动式智能体:支持目标驱动、自主规划、定时执行、后台运行(扣子2.0/空间)。
1.3 应用场景
- 个人用户:生活助手、内容创作、学习辅导、自媒体运营、日程与资产管理。
- 中小企业:智能客服、员工助手、销售顾问、活动运营、客户管理、轻量流程自动化。
- 内容创作者:文案生成、视频脚本、直播话术、社媒内容、数据分析报告。
- 行业场景:电商导购、教育助教、金融投顾、旅游规划、健康咨询、本地生活服务。
- 生态变现:行业专家封装技能/插件至技能商店,实现能力变现。
2. Dify
2.1 定义
Dify 是全球领先的开源大语言模型(LLM)应用开发与LLMOps平台 (Apache 2.0协议),由LangGenius团队开发,核心理念为"Define + Modify "。定位为生产级、可私有化部署的智能体与AI应用构建引擎,面向开发者、技术团队与中大型企业,提供全栈、灵活、可控的AI开发能力。
2.2 作用与功能
- 开源可私有化:全栈代码开源、支持Docker/云托管/本地部署、保障数据主权与安全合规。
- 全模型兼容:无缝集成GPT、Llama、文心一言、通义千问、DeepSeek等数百种模型。
- 可视化工作流:低代码画布编排,支持条件分支、循环、代码节点、子流程嵌套、复杂Agent逻辑。
- 深度RAG技术:知识管道、混合检索、重排序(Rerank)、多知识库联合、文档深度解析。
- 智能体框架:支持ReAct、Plan-and-Execute、函数调用,自主任务拆解、多工具调用、反思纠错。
- 企业级LLMOps:应用监控、日志审计、成本分析、A/B测试、版本管理、团队协作与权限管控。
- 开放扩展:50+官方插件、支持自定义API/工具、直连数据库/Notion/飞书/语雀等数据源。
2.3 应用场景
- 技术团队:快速原型开发、定制化Agent、私有模型部署、AI系统集成。
- 中大型企业:核心业务AI化、内部知识库问答、数据洞察、高安全流程自动化。
- 金融/政府/医疗:合规私有化部署、敏感数据处理、内部助手、风控与合规审查。
- SaaS厂商:为产品嵌入AI能力、构建垂直行业Agent、低代码二次开发。
- 开源社区:基于Dify二次开发、构建行业解决方案、参与共建AI生态。
三、Dify下载与安装
1. 下载dify
通过 Gitee 镜像仓库下载 Dify 源码压缩包:
- 访问下载地址:https://gitee.com/dify_ai/dify/repository/archive/main.zip,下载 Dify 源码压缩包。
- 下载完成后,可在本地目录中看到
dify-main.zip文件(约32MB),该文件为 Dify 完整源码包,后续可基于此文件进行部署安装。

2. 解压 Dify 源码包
- 找到下载好的
dify-main.zip压缩包,右键点击文件,选择「全部解压缩」选项。 - 在弹出的解压窗口中,设置解压目标路径(如
D:\docker,建议选择非系统盘目录),点击「提取」按钮。 - 等待解压完成,解压后将得到
dify-main目录,后续的 Docker 部署操作将在此目录中进行。

3. 配置 Dify 环境变量
- 进入解压后的 Dify 源码目录,导航到
dify-main/docker文件夹,路径示例:此电脑 > Data (D:) > docker > dify-main > docker。 - 复制该目录下的
.env.example文件,并将副本重命名为.env。该.env文件是 Dify 的核心环境变量配置文件,后续可根据需要修改其中的数据库、端口、模型密钥等参数。💡 补充说明:.env.example是官方提供的模板文件,复制为.env后,Docker 部署脚本会自动读取其中的配置信息,完成服务的初始化设置。

4. 启动 Dify 服务
-
打开 Windows 命令提示符(CMD),切换到 Dify 的
docker目录:cmdd: cd docker\dify-main\docker -
执行以下命令启动所有 Dify 服务容器:
cmddocker compose up -d -
执行命令后,终端会自动拉取所需镜像并启动容器。当看到所有服务的状态显示为
Pulled(镜像拉取完成)、Created(网络创建)、Started/Healthy(容器启动并健康运行)时,表示 Dify 服务已成功启动。启动完成后,可通过浏览器访问http://localhost进入 Dify 初始化页面。

5. 浏览器访问 Dify 并初始化
- 打开浏览器,在地址栏输入
http://127.0.0.1/signin,首次访问会跳转到管理员账户设置页面。 - 在设置页面中,依次输入邮箱、用户名和密码,完成管理员账号的创建,点击「设置」按钮提交。

- 配置完成后,系统会自动跳转到 Dify 工作室主界面,此时可以创建应用、接入知识库、配置智能体,开始使用 Dify 平台。
