ai工程

__土块__7 天前
可观测性·系统稳定性·生产故障·ai工程·会话记忆·故障复盘·后台设计
AI 会话记忆模块静默失效:一次从链路耦合到分层治理的工程复盘在 AI 应用中,会话记忆(Conversation Memory)是维持上下文连贯性的核心模块。尤其在多轮对话、RAG 增强、Agent 决策等场景中,记忆模块的稳定性直接影响用户体验与系统可靠性。我们的目标是构建一个高可用的记忆系统,确保在模型路由、工具调用、会话切换等复杂链路中,记忆读写始终可预期、可追踪、可恢复。
__土块__7 天前
线程池·可观测性·任务调度·系统稳定性·生产故障·ai工程·执行隔离
AI 任务调度器频繁超时:一次从线程争用到执行隔离的工程复盘2026 年 3 月中旬,某企业 AI 问答平台上线后,用户反馈“提交任务后长时间卡在‘处理中’状态”,部分任务在 30 秒后返回超时错误。初期怀疑是模型推理慢,但监控显示模型平均响应时间为 800ms,远低于超时阈值。进一步排查发现,任务调度器(Scheduler)自身成为瓶颈——尽管任务已成功入队,但实际执行延迟高达 15~25 秒。
发光的叮当猫13 天前
ai工程
对基础模型的理解英语在互联网上占据主导地位,其次是中文。那些训练数据有限的语言,被称为低资源语言。能否将非英语语言的查询翻译成英语,获取回答后再翻译回原语言? 答案是否定的,首先,它需要模型充分理解代表性不足的语言,才能进行准确翻译;其次,翻译过程可能导致信息丢失。
发光的叮当猫16 天前
ai工程
AI工程中关于模型评估和提示工程的问题1,指令遵循能力* 制定指令遵循标准,比如,可以从这几个类型设置指令和描述,“关键词”,“语言”,“长度限制”,“可检测内容”,“可检测格式”等。
AI精钢17 天前
人工智能·llm·claude·ai工程·ai可靠性
Adaptive Thinking 的代价:当 AI 自己决定“想多少“2026 年初,一份来自 AMD 内部的量化审计报告安静地投进了 GitHub issue tracker,然后炸开了锅。
发光的叮当猫17 天前
人工智能·微调·rag·ai工程
AI工程可能会遇到的一些问题1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。
蔡俊锋24 天前
人工智能·ai提示词·ai工程·ai沟通
AI提示词零基础入门:从“无效提问”到“精准输出”,核心方法论全拆解掌握与AI对话的底层逻辑,一篇搞定提示词核心概念、万能结构与避坑指南 本文标签:#人工智能 #大模型 #提示词 #Prompt #AI入门 #AIGC #效率工具
蔡俊锋25 天前
人工智能·ai工程·ai原子能力·ai乐高工程
用AI实现乐高式大型可插拔系统的技术方案通过AI实现「可配置、可插拔、自由组装」的大型系统,且AI原子能力是这套架构的核心基石——就像乐高的基础积木,没有标准化、单一职责的原子单元,就不可能实现真正的自由组装。AI在这套体系中同时承担两个核心角色:一是系统能力的原子化组件,二是全生命周期的开发、编排、运维工具。
YoanAILab1 个月前
大模型部署·ai平台·ai工程·ai基础设施·ai项目实战
大模型平台是怎么跑起来的?从 GPU 到 API 全链路拆解(工程视角)很多人在接触大模型时,通常只关注:但在实际工程项目中,更关键的问题是:❓ 模型是怎么“跑起来”的?从 GPU 到最终 API 服务,中间到底经历了什么?
YoanAILab1 个月前
人工智能·dify·rag·技术成长·ai平台·ai工程
Dify 是怎么工作的?一篇讲清 AI 应用平台架构(工程视角)很多人第一次接触 Dify 时,会觉得它像一个“低代码 AI 工具”:于是很容易得出一个表面的结论:Dify 就是一个 AI 可视化搭建工具。
YoanAILab1 个月前
人工智能·系统架构·comfyui·dify·vllm·ai工程
AI 推理系统架构怎么选?图像生成与文本生成的分层选型思路(ComfyUI / Dify / vLLM / Triton)在 AI 项目真正落地时,一个非常常见的问题是:模型已经能跑了,但系统架构到底该怎么选?很多团队在做 AI 推理系统时,常常会把几类方案混在一起讨论:
寒水馨9 个月前
人工智能·ai·prompt·agent·ai agent·ai工程
构建企业级 AI Agent:不只是 Prompt 工程,更是系统工程近年来,随着大语言模型(LLM)能力的快速提升,AI Agent 成为了技术圈内炙手可热的话题。从最初的“调用 API 玩玩”到如今尝试将其部署进生产环境,越来越多的企业开始意识到:仅仅依靠 Prompt 来驱动 LLM 并不能构建出一个稳定、可控、可扩展的智能代理系统。
我是有底线的