技术栈
ai工程
__土块__
7 天前
可观测性
·
系统稳定性
·
生产故障
·
ai工程
·
会话记忆
·
故障复盘
·
后台设计
AI 会话记忆模块静默失效:一次从链路耦合到分层治理的工程复盘
在 AI 应用中,会话记忆(Conversation Memory)是维持上下文连贯性的核心模块。尤其在多轮对话、RAG 增强、Agent 决策等场景中,记忆模块的稳定性直接影响用户体验与系统可靠性。我们的目标是构建一个高可用的记忆系统,确保在模型路由、工具调用、会话切换等复杂链路中,记忆读写始终可预期、可追踪、可恢复。
__土块__
7 天前
线程池
·
可观测性
·
任务调度
·
系统稳定性
·
生产故障
·
ai工程
·
执行隔离
AI 任务调度器频繁超时:一次从线程争用到执行隔离的工程复盘
2026 年 3 月中旬,某企业 AI 问答平台上线后,用户反馈“提交任务后长时间卡在‘处理中’状态”,部分任务在 30 秒后返回超时错误。初期怀疑是模型推理慢,但监控显示模型平均响应时间为 800ms,远低于超时阈值。进一步排查发现,任务调度器(Scheduler)自身成为瓶颈——尽管任务已成功入队,但实际执行延迟高达 15~25 秒。
发光的叮当猫
13 天前
ai工程
对基础模型的理解
英语在互联网上占据主导地位,其次是中文。那些训练数据有限的语言,被称为低资源语言。能否将非英语语言的查询翻译成英语,获取回答后再翻译回原语言? 答案是否定的,首先,它需要模型充分理解代表性不足的语言,才能进行准确翻译;其次,翻译过程可能导致信息丢失。
发光的叮当猫
16 天前
ai工程
AI工程中关于模型评估和提示工程的问题
1,指令遵循能力* 制定指令遵循标准,比如,可以从这几个类型设置指令和描述,“关键词”,“语言”,“长度限制”,“可检测内容”,“可检测格式”等。
AI精钢
17 天前
人工智能
·
llm
·
claude
·
ai工程
·
ai可靠性
Adaptive Thinking 的代价:当 AI 自己决定“想多少“
2026 年初,一份来自 AMD 内部的量化审计报告安静地投进了 GitHub issue tracker,然后炸开了锅。
发光的叮当猫
17 天前
人工智能
·
微调
·
rag
·
ai工程
AI工程可能会遇到的一些问题
1,检索质量太差,根本没有检索到正确内容原因:embedding不行,相似度算错,语义没对齐。query没有被改写,完全没有上下文,检索失败。
蔡俊锋
24 天前
人工智能
·
ai提示词
·
ai工程
·
ai沟通
AI提示词零基础入门:从“无效提问”到“精准输出”,核心方法论全拆解
掌握与AI对话的底层逻辑,一篇搞定提示词核心概念、万能结构与避坑指南 本文标签:#人工智能 #大模型 #提示词 #Prompt #AI入门 #AIGC #效率工具
蔡俊锋
25 天前
人工智能
·
ai工程
·
ai原子能力
·
ai乐高工程
用AI实现乐高式大型可插拔系统的技术方案
通过AI实现「可配置、可插拔、自由组装」的大型系统,且AI原子能力是这套架构的核心基石——就像乐高的基础积木,没有标准化、单一职责的原子单元,就不可能实现真正的自由组装。AI在这套体系中同时承担两个核心角色:一是系统能力的原子化组件,二是全生命周期的开发、编排、运维工具。
YoanAILab
1 个月前
大模型部署
·
ai平台
·
ai工程
·
ai基础设施
·
ai项目实战
大模型平台是怎么跑起来的?从 GPU 到 API 全链路拆解(工程视角)
很多人在接触大模型时,通常只关注:但在实际工程项目中,更关键的问题是:❓ 模型是怎么“跑起来”的?从 GPU 到最终 API 服务,中间到底经历了什么?
YoanAILab
1 个月前
人工智能
·
dify
·
rag
·
技术成长
·
ai平台
·
ai工程
Dify 是怎么工作的?一篇讲清 AI 应用平台架构(工程视角)
很多人第一次接触 Dify 时,会觉得它像一个“低代码 AI 工具”:于是很容易得出一个表面的结论:Dify 就是一个 AI 可视化搭建工具。
YoanAILab
1 个月前
人工智能
·
系统架构
·
comfyui
·
dify
·
vllm
·
ai工程
AI 推理系统架构怎么选?图像生成与文本生成的分层选型思路(ComfyUI / Dify / vLLM / Triton)
在 AI 项目真正落地时,一个非常常见的问题是:模型已经能跑了,但系统架构到底该怎么选?很多团队在做 AI 推理系统时,常常会把几类方案混在一起讨论:
寒水馨
9 个月前
人工智能
·
ai
·
prompt
·
agent
·
ai agent
·
ai工程
构建企业级 AI Agent:不只是 Prompt 工程,更是系统工程
近年来,随着大语言模型(LLM)能力的快速提升,AI Agent 成为了技术圈内炙手可热的话题。从最初的“调用 API 玩玩”到如今尝试将其部署进生产环境,越来越多的企业开始意识到:仅仅依靠 Prompt 来驱动 LLM 并不能构建出一个稳定、可控、可扩展的智能代理系统。
我是有底线的