引言
DeepSeek 以迅雷之势席卷全球,并以实战为突破点,推动 AI 技术在实际应用中的深刻变革。我们站在这个新起点上,远眺 AI 技术落地最汹涌的浪潮。各行各业正积极探索如何利用 DeepSeek 等前沿 AI 技术实现业务创新。在众多 AI 技术和应用中,找到那些真正具有颠覆性和引领性的方向,并实现切实可行的落地应用,已成为企业当前关键的战略思考。
3 月 22 日,由腾讯云架构师技术同盟 与腾讯云 TVP 联合主办的「DeepSeek 实战驱动行业智变------腾讯云架构师技术沙龙」成功举办。本次活动邀请到 AI 领域的大咖分享 DeepSeek 落地案例的宝贵经验,共同探寻 AI 技术赋能业务智能化变革的进阶路径。
腾讯云架构师技术同盟上海分会正式成立
同程旅行出行事业群CTO、腾讯云架构师技术同盟活动组织主席 王晓波
大会伊始,同程旅行出行事业群CTO、腾讯云架构师技术同盟活动组织主席 王晓波主持开场。他介绍本次腾讯云架构师技术沙龙是腾讯云面向广大架构师与资深开发者举办的技术交流活动,聚焦前沿话题,汇聚专家智慧,深度探讨,携手共创,用最专业的分享与思辨,助力广大架构师共同成长!
「腾讯云架构师技术同盟」是腾讯云为架构领域知名专家与从业精英打造的专业技术社交圈,通过多样的技术交流会议、社群专业探讨、权威内容输出,打造业界领先的架构师专业技术同盟。
腾讯云架构师技术同盟主席 毛剑
腾讯云架构师技术同盟主席 毛剑宣布,腾讯云架构师技术同盟首个分会------上海分会正式成立。腾讯云架构师技术同盟上海分会作为国内首个启动的地区同盟,肩负引领地区同盟发展的重任。未来腾讯云架构师技术同盟将计划扩展至北京、深圳、广州、成都等地,以本地化方式促进技术交流,以开展各种线上线下活动,吸引更多优秀架构师参与,帮助更多架构师成长发展。
会上,腾讯云架构师技术同盟上海地区理事会同时成立,由 12 位腾讯云架构师名人堂专家担任理事。毛剑为各位理事颁发聘书,以感谢他们对上海分会作出的支持与贡献。
ClickPaaS CPO、腾讯云架构师技术同盟上海地区理事会理事长 马俊表示,感谢腾讯对我的信任,作为上海地区理事会理事长,我深感责任重大,面对聚集架构师行业顶尖人才的压力,我决心将压力转化为动力。我们将致力通过腾讯云搭建的平台助力架构师成长,促进技术的普惠性和公益性,特别是帮助年轻的架构师提升自我、创造价值。
ClickPaaS CPO、腾讯云架构师技术同盟上海地区理事会理事长 马俊
DeepSeek创新驱动的AI应用寒武纪
CSDN高级副总裁、全球机器学习技术大会主席 李建忠
在主题演讲环节中,CSDN 高级副总裁、全球机器学习技术大会主席 李建忠发表题为《DeepSeek 创新驱动的 AI 应用寒武纪》的报告,介绍 DeepSeek 的关键技术创新、对 AI 生态的深远影响、AI 产品的范式转换立方体以及 AI Agent 智能体应用爆发寒武纪。
李建忠表示,DeepSeek 的关键技术创新有以下方面:
1、开源强化学习引领推理计算范式转换
DeepSeek R1 基于强化学习和 Self-play 实现推理的 Scaling Law,隐式思维链使模型学会中间过程的推理路径。DeepSeek 的出现,将大模型从预训练阶段的"统计学习" ,转变为推理阶段的"探索创新" ,完成了从"快思考"到"慢思考" 的飞跃。
2、MLA 和 MoE 等引领大模型架构创新
DeepSeek 在基于 Transformer 架构的基础上进行多项优化,例如 MLA 用于高效推理,显著降低推理显存的消耗。MOE 用于高效训练,其由多个专家模型组成,通过部分激活给定任务所需的特定专家,而不是激活整个神经网络,从而降低计算消耗。DeepSeek 使用高难度的 256 个路由专家和1个共享专家,并创新的采用冗余专家,来实现负载均衡策略和训练目标。
3、"贴身定制"的软硬协同工程优化
DeepSeek 从计算、存储、通信等多个层面实施了软硬协同的工程优化策略。面对算力限制,DeepSeek 采取了一系列措施,如混合精度训练、跨节点通信优化、双流水线机制、DualPipe 算法等,以实现高性能计算。李建忠表示,如果 DeepSeek 成为开源大模型领域的标配后,有机会通过"软件定义硬件"或者说 "模型定义硬件"来倒逼硬件厂商,走出一条颠覆英伟达 CUDA 生态的道路。
接着,李建忠探讨 DeepSeek 对 AI 生态系统的重要意义。一是随着 DeepSeek 大幅降低大模型的成本,推理和搜索的成本已接近甚至低于传统搜索引擎,这为 AI 应用的大规模普及创造条件,将迎来"寒武纪"式 AI 应用爆发。二是 DeepSeek 从 "训练"和"推理"重塑算力生态,AI 产业版图有望重塑。三是开源长期主义是创新摇篮,DeepSeek 从第一天就拥抱开源。这种开放的态度赢得全球开发者的广泛支持,越来越多的开发者和企业开始拥抱 DeepSeek 的开源解决方案。
针对 AI 产品的范式转换,李建忠创新提出"范式转换立方体"概念,该理论基于 X 轴(技术)、Y 轴(需求)和 Z 轴(模态)。X 轴涵盖计算和技术的发展阶段;Y 轴关注人类的核心需求领域,如信息、娱乐、搜索、社交及商业;Z 轴则代表了不同模态的变化,从文本到图片、音频、视频等。通过这三个维度的交叉分析,可以发现创新机会点。
随着 AI 智能体的兴起,技术正从信息网络向行动网络转变。智能体通过强大的推理、规划和执行能力,不仅弥补了大模型的不足,还实现主动交互,如自动安排会议和预订机票,这里需要多智能体的协作,而不是全由一个模型来完成。未来互联网将更多服务于智能体,可能需要改变搜索、广告、电商等模式,使其更适应智能体的需求,进而重构整个互联网架构和商业模式。因此李建忠表示,未来的产品,将从面向"人类"的需求, 转变为面向"智能体"的需求。
构建基于Ray框架的RL训练与分布式推理
bilibili 机器学习平台负责人、腾讯云架构师名人堂专家 孙英男
bilibili 机器学习平台负责人、腾讯云架构师名人堂专家 孙英男带来《构建基于Ray 框架的 RL 训练与分布式推理》的主题演讲,探讨 DeepSeek 模型带来的范式变革,阐述如何利用 Ray 框架构建强化学习训练和推理系统。
DeepSeek 带来哪些技术范式变革?孙英男表示,DeepSeek-R1 作为推理模型,其能力得到显著提升。DeepSeek-R1 工作亮点有以下几点:一是结合 MOE+GRPO 训练整体成本低 ;二是 RL 驱动推理能力进化,验证 RL scaling 命题;三是对 Dense 模型蒸馏可大幅提升效果;四是证明 PRM 和 MCTS 路径走不通。
DeepSeek 开源后,驱动 AI 基础设施革新。 DeepSeek 开源大量的工程工作,涉及从推理框架到底层算子全栈优化,AI 工程、INF 工程、SYS 工程,还进行大量推理成本优化工作。平台还在大规模 RL 训练 pipeline、高效分布式在/离线推理等方面做了许多重点工作。
接着,孙英男从框架的视角来介绍强化学习训练与推理。强化学习通过智能体与环境的互动来学习最优决策过程。 智能体根据当前环境状态,使用策略网络决定采取的动作,以改变环境并获得奖励。随后,他详细介绍 PPO 和 GRPO 两种强化学习训练方法。PPO是一个推理和训练混合的过程,涉及多个模型( Actor / Critic / Reward / Reference 模型),通过采样和反向传播更新模型参数。相比之下,GRPO 没有 Value 模型,减少训练成本。
然而,RL 训练的过程中,面临多模型多阶段任务流、推理&训练的差异性、模型参数量持续增长等问题。为了应对多卡环境下的挑战,孙英男表示,使用 Ray 框架进行高效分布式训练和推理的方法。 Ray 能够动态规划计算图,简化训练过程,并支持灵活的任务编排和资源调度。
Ray 框架最早应用于强化学习场景,支持 Single Controller,它通过封装无状态计算为 Task,并通过 Actor 抽象有状态存储,实现高效的资源调度和复用。具体实现中,Ray 可以将不同的模型分配到不同的显卡和机器上,形成一个高效的分布式训练和推理系统。目前社区基于 ray 的 RL 框架有 OpenRLHF、veRL 等。
最后,孙英男详细展开介绍推理侧落地 Ray 的场景:分布式推理、离线批量推理、GPU 分时复用。通过本次演讲,孙英男让我们清晰地看到在复杂的技术背后, 如何借助 Ray 框架实现高效的强化学习训练与分布式推理,为 Deepseek 实际应用提供坚实的技术支撑。
腾讯云顾问,用AI重塑SRE
腾讯云顾问产品总经理、腾讯云架构师名人堂专家 许小川
腾讯云顾问产品总经理、腾讯云架构师名人堂专家 许小川在《DeepSeek 下的高效运维之路》的报告中,分享腾讯云顾问的最新进展和创新实践,阐述云顾问产品如何凭借其 AI 驱动的架构治理能力,引领云架构可视化治理的新时代。
许小川指出,DeepSeek 技术在不同行业的应用和渗透情况各不相同。他提到,尽管 AI 技术的潜力巨大,但不同行业对 AI 的使用程度和深度渗透率存在显著差异。这表明,AI 技术的广泛应用仍需克服行业特定的挑战和障碍。许小川强调高质量数据在 AI 项目工程落地中的重要性,并分享腾讯云在 AI 项目落地方面的经验和教训,并说明数据质量和工程实践的重要性。
云顾问是腾讯云提供的 AI 原生的一站式云上治理平台,旨在帮助企业优化云资源管理、提升系统稳定性并降低成本。云顾问基于腾讯云卓越架构理念"3层×6支柱"(3层:应用层、架构层、资源层,6支柱:安全、性能、成本、可持续、卓越运营、可靠性),提供可视化架构绘制和管理体验。
云顾问在产品构建理念上进行了优化和创新:相较于传统运维习惯使用的还原论方法,云顾问采用了系统论的视角,帮助客户从整体和系统层面,"看全"云架构,"看清"云架构,从而进行更全面和准确的治理。
许小川详细介绍了通过接入混元+DeepSeek,腾讯云顾问打造的全链路智能生图、ChatBI、以及在开发中的 AI 订阅等能力。
➢ 全链路智能生图: 运维工程师在绘制架构图时,经常遇到由于业务变更快、实例配置漂移等问题带来的"图难对上实"的现象。为此,腾讯云顾问推出了"全链路智能生图"功能,让绘图和架构管理变得更实时更简单:
- 全链路智能推理:基于资源配置、监控、日志等数据,AI 自动梳理上下游调用关系,一键生成精准拓扑图,实时追踪资源变动,消除"静态图纸"与"动态系统"偏差。
- 风险生图/护航生图:自动生成风险中心或护航场景专属架构图,标注问题节点及影响范围,保障系统稳定运行。
- 智能布局与定制化视图:AI 自动逻辑分层资源关系,按业务视角(成本、性能、安全)生成架构图,满足不同角色需求
➢ ChatBI:在云运维中,如何快速获取架构状态的关键信息、更灵活地调整监控与看板配置,往往对运维效率影响重大。针对这些需求,腾讯云顾问推出了 ChatBI 能力:
- 自然语言查询:轻松查询架构监控数据,快速定位问题。
- 高效微调与输出:借助 Text2SQL 技术,灵活调整并生成定制化图卡与图表。
- 业务特性监控:结合架构逻辑生成专属 Dashboard,实时洞察架构健康趋势。
最后,许小川探讨云顾问产品未来的发展方向,包括更便捷、更智能的产品体验。他强调数据、可视化、治理的闭环驱动力在 AI 场景落地中的重要性 "AI 在运维中应用的关键在数据, 数据的关键在治理,治理的关键在可视化。" ,并表示将继续优化腾讯云顾问产品的功能和用户体验,推广数据、治理、可视化的理念和方法,用 AI 重塑 SRE。
DeepSeek时代,金融行业的创新与探索
平安资产管理资深架构师、腾讯云架构师名人堂专家 屠乐奇
平安资产管理资深架构师、腾讯云架构师名人堂专家 屠乐奇以《DeepSeek 创新驱动下的金融应用和探索》为主题,详细阐述平安资管如何利用大模型技术推动金融领域的创新与实践。
关于金融行业对大模型的选型,屠乐奇表示,重点考虑私有化部署、安全性以及性能成本等因素。由于金融公司对从数据安全要求严格,大模型私有化部署是选型的先决条件。他们倾向于选择国产开源大模型,以确保数据安全和易于维护。这些国产大模型不仅满足金融行业的严格要求,还提供从高性能版的一体机到蒸馏版本的灵活部署选项,适应不同的业务需求。
如今,银行、证券公司、证券公司等金融机构都在部署大模型,都在探索大模型的应用及企业落地。目前,大模型可应用于金融行业的多个领域,包括交易支持、投研助理、流程优化和客户服务等。例如,在交易支持方面,投资经理可以利用大模型处理复杂的数据分析任务;在投研助理角色中,大模型帮助分析师完成数据分析工作;通过引入大模型,还可以加速金融交易系统的自动化进程,减少人工干预。
接着,屠乐奇分享大模型辅助金融行业的两类工作实践:一是结合内部知识库的大模型问答,如通过网页嵌入大模型问答,集成聊天工具集成,开放制作完成的简易智能体问答,内部文档可直接接入知识库, 将知识库上传权限开放给用户;二是量化策略开发,有助于回测策略编写,效率提高 30%,论文检索,投资信号制定,辅助择时,研报财报文生策略等。
最后,屠乐奇通过具体的流程优化案例来展示如何使用大模型简化交易过程中的繁琐步骤,大大提高处理效率。例如通过自然语言处理技术,大模型能自动识别并匹配交易相关的信息,大幅减少手动输入的工作量。他还分享如何利用规则引擎校验生成的数据,进一步确保数据的准确性和一致性。具体来说,通过大语言模型对自然语言进行初步处理,再结合数据字典进行精确匹配,最终形成可供系统使用的结构化数据。
通过屠乐奇的分享,让我们看到大模型在金融领域的创新实践,助力金融机构提升效率、优化服务,让大家对 AI 在金融行业的应用有更直观的了解。
深度解析AI如何落地企业
广东省连锁经营协会技术委员会主席、腾讯云架构师名人堂专家 沈欣
广东省连锁经营协会技术委员会主席、腾讯云架构师名人堂专家 沈欣在《2025 AI 落地指南------从 DeepSeek 谈起》的演讲中,探讨 AI 技术在企业中的应用与探索,并提出具体实施的方法论和组织调整策略。
沈欣指出,AI 落地逻辑为效率外挂和大脑服务,通过 AI 提高工作效率,对于大型企业来说,这会变成大脑的服务。在讨论大模型作为企业"大脑外挂"时,沈欣将其分为四大类:一是广义翻译类,可低成本精准翻译,自动匹配场景和文化;二是信息类,解放人工劳动力,通过 AI 自动完成数据汇总、格式整理等工作;三是知识类,从数据中提取规则并沉淀为知识库,为企业的日常运营提供辅助支持;四是意图类,根据知识和数据判断意图并执行操作。沈欣提醒道,在实施上述各类应用的过程中,企业可能会经历一个阵痛期。企业应逐步完善规则体系,才能真正享受到 AI 带来的长期红利。
大模型在企业落地的重点,沈欣表示企业在实施 AI 时可遵循一些方法论,在宏观上,进行认知重建,认识到 AI 作为战略转型的关键驱动力,无论主观还是客观,AI 是必选题;在介观上,确定谁来做,有没有对应的组织体系来面对 AI;在微观上,聚焦具体实践和技术优化。总的来说,企业需从战略到执行全面布局,才能最大化利用大模型技术的优势。
随后,他分享 AI 在企业内部研发体系的落地,通过引入 AI,优化需求与产品团队的协作流程,明确每个需求的商业价值,并使用零代码、低代码及 AI 辅助编程提升开发效率,还有 PM 项目管理系统,确保交付质量和落地执行,最下面使用 AI 运维,确保系统正常运行。沈欣表示,尽管 OpenAI 预测 AI 将大幅减少可替代岗位,但从 2023-2024 年的实际情况来看,这些岗位的需求反而在增加。真相是减少能被 AI 替代工种的人力,其实并没有获得生产力提升的红利。 如何享受红利并进行商业模式的迭代?沈欣表示,一是扩大这部分团队,降低该工种的平均收入; 二是解决其他不平衡部分的瓶颈;三是充分用 AI 赋能,获取最大的生产力提升红利。
为了有效落地 AI 技术,CIO 需先行推动变革。沈欣给出以下具体建议:
- 安全规范先行,公有 AI 和内部数据、知识的隔离规范;
- AI智能体协同低代码,可以快速实现功能:"AI+"和"+AI" ,减少和某个特定 AI大语言模型的绑定关系;
- 考虑私有化+公有 AI 的混合结构,降低成本和增加灵活性;
- 和 HR 一起搭建数字员工体系和知识体系;
- 把开发解放出来以后,让老的技术人员进入业务部门作为 IT BP,提升业务满意度;
- 多出去交流,看同行怎么用。
沈欣强调,在探讨 AI 技术在企业中的应用与探索时,需要重点关注安全问题和创新, "AI 的引入,不是让机器人去更快的抄书,而是设计出打印机,并通过卖墨盒挣钱。"
腾讯云AI代码助手+DeepSeek,掀起全场景编程革命
腾讯云产品专家 汪晟杰
腾讯云产品专家 汪晟杰在《从需求到代码:DeepSeek+AI 代码助手的全场景编程革命》的分享中,从 DeepSeek 对开发者的助力、AI 产品创新探索及应用、场景接入的反馈以及未来展望这四个方向来介绍腾讯云 AI 代码助手如何利用 DeepSeek 模型,实现全场景编程革命。
传统的开发流程涉及需求沟通、编码、测试、发布上线等环节,在 AI 时代,每个环节都可以通过不同的模型进行优化,从而提高整体效率和质量。例如,在编码过程中,当输入"IF"时,AI 可以自动补全条件语句,减少打字量并提高生产力。此外,AI 还可以帮助调试代码,重构不理想的代码片段,并确保符合研发规范。
腾讯云推出 AI 代码助手,支持代码补全、技术问答、多文件生成、AGENT 智能体等核心能力,并可以支持 RAG 知识库、自定义指令、多模型切换、企业账号集成等自定义功能。 每个模块背后都有不同的模型支持,如补全模型用于代码补全,对话模型用于处理开发者与 AI 之间的交互。以下为腾讯云 AI 代码助手的特性:
- 代码补全特性强化:在编写代码时,实时根据光标位置,通过 AST 语法树结构,感知当前代码仓库中的关联性代码,实现精准补全;
- 技术问答特性 :通过侧栏对话、内联对话、指令集等功能,为开发者提供全编码周期的实时技术问题求解能力;
- 全面支持 DeepSeek R1/V3 (满血版)& 本地 Ollama 服务接入 DeepSeek;
- 技术问答特性:企业结合企业专属知识进行回答,专属知识包含企业的研发规范、接口规范、业务框架、代码框架、垂直的业务知识等。
- 软件开发者智能体 Craft:通过自然语言指令,AI 深度理解需求,自主完成多文件代码编写与修改,自动生成可执行的应用
- 单元测试智能体产品特性:支持基于代码上下文自动构建符合主流测试框架的单元测试代码,支持根据函数输入输出定义自动填充逻辑语言,并通过语法树解析精准识别被测模块的依赖关系,自动注入 MOCK 数据并生成边界测试用例。
- AICR 智能体特性:基于深度学习的静态分析引擎,自动检测代码质量缺陷、安全漏洞及架构异味,覆盖百款主流编程语言。
通过对招行和荣耀等企业的实际应用案例分析,汪晟杰展示腾讯云 AI 代码助手如何帮助企业快速构建面向特定领域的编码助手。
最后,汪晟杰介绍 AI 编程的演进以及探讨未来发展趋势:2022 年,聚焦补全;2023 年,以模型+对话+知识库为主;2024 年,智能体爆发,AI 代码助手将朝着更加自主化和智能化的方向发展。2025 年,往 Agentic SWE 方向发展,AI 不仅能自动编排流程,还能自我推导出最优解决方案。2026 年,迈向真正的 AGI,在这个过程中,AI 将与人类开发者形成紧密的合作关系,共同完成复杂的编程任务。 "让 AI 助手成为你真正的 AI 代码助手,其模型通过不断沉淀推理和经验,持续进化,真正与开发者共同成长。"
结语
回顾本次腾讯云架构师技术沙龙,嘉宾们不仅展示 DeepSeek 的技术创新,还分享AI技术在各行各业的最新落地实践,向我们展示 AI 未来发展的无限可能。此次沙龙为架构师们搭建一个交流合作的平台,相信今天的每一场分享,每一次交流,都让开发者对 AI 技术赋能业务智能化变革有了更深入的理解。
会上,腾讯云架构师技术同盟上海分会正式扬帆启航,未来将引领地区同盟发展,汇聚更多优秀架构师,不断壮大本地技术力量,为架构师行业发展注入新的活力。未来,腾讯云架构师技术同盟将走进更多城市,通过腾讯云架构师技术沙龙等交流活动,与你共探技术新发展, 共话新未来。