llm

冬奇Lab30 分钟前
人工智能·llm·agent
Agent 系列(13):Agent 安全与防护——提示词注入、工具滥用、数据泄露怎么防普通 LLM 应用的攻击面就是:用户输入 → LLM 输出。Agent 加了工具之后,攻击面扩大了三倍:
装不满的克莱因瓶4 小时前
人工智能·python·ai·langchain·llm·agent·智能体
学习并掌握 LangChain 检索器的作用,实现让 LLM 动态调用知识库功能目录一、前言一、为什么 LLM 需要 Retriever二、Retriever 的本质三、Retriever 工作流程
惟愿光怪陆离5 小时前
llm
OpenCode 注意事项摘要:在使用 OpenCode 进行 AI 辅助开发时,理解其底层运行机制至关重要。本文深入剖析了 OpenCode 的四大核心模块:上下文压缩策略、MCP 工具加载机制、系统提示词组装逻辑以及 Skill 文件索引原理。掌握这些细节,将帮助你避开“技能丢失”、“Token 爆炸”等常见坑点,写出更稳定的 Agent 配置。
初旭save9 小时前
llm·agent·claude
Agent Skill 不是写 Prompt,是给 LLM 做存储分层Skill 的核心不是"塞更多指令",而是把 LLM 的上下文窗口当 RAM、文件系统当 Disk——什么时候加载什么内容,比写了什么内容更重要。
AINative软件工程12 小时前
llm
LLM 应用的 Rate Limiting 工程实战:Per-User Token 配额、滑动窗口限流与优先级队列的生产落地当日调用量从 1000 涨到 10 万,429 错误率从 0.1% 飙到 8%。本文用真实场景演示如何在应用层构建四层防护:Token Bucket 令牌桶、滑动窗口计数器、优先级队列,加上 Circuit Breaker,每层附可运行的 TypeScript/Node.js 代码。
晨欣1 天前
llm·claude·anthropic·claude code·harness
Claude Opus 4.8:模型小幅升级,平台大步向前阅读时长 7 分钟 | Model ID: claude-opus-4-8 | 上下文窗口 ≤ 1M tokens
lhxcc_fly1 天前
langchain·llm·rag
6.LangChain--RAG当前对于大部分人来说我们利用LLM都是进行AI搜索来帮助我们进行知识的获取与总结。用一个租房项目的本地文件为知识库的一个案例演示。
lhxcc_fly1 天前
langchain·llm·rag
6.1RAG--文档加载器LangChain ⽂档加载器可以将各种数据源加载成⼀系列的⽂档对象 DocumentMarkdown文档类型:
AINative软件工程1 天前
llm
LLM 推理成本工程:从 Token 计量到分层路由的生产降本实践你的 LLM 月度账单是多少?两年前,这个问题几乎没有工程师关心——用量小、单价高、成本被增长焦虑掩盖。现在不一样了。主流推理模型的价格已从两年前的 20/百万Token降至20/百万 Token 降至 20/百万Token降至0.07/百万 Token,降幅超过 99%。但这个「好消息」的另一面是:中国日均 Token 调用量从 2024 年初的 1000 亿飙升至 2025 年底的 100 万亿。
dy_Alley1 天前
llm
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第六章《置信度决策路由》意图分类的结果不是 100% 可靠的。置信度决策路由就是根据"系统有多确定"来决定走哪条路——高置信直接处理、中置信先确认、低置信兜底转人工。
dy_Alley1 天前
llm
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第七章《集成与组装》前六章分别讲了 6 层的独立实现。本章解决最后一个问题:怎么把它们组装成一个可运行的完整系统。核心内容:
codefan※1 天前
人工智能·大模型·llm·知识图谱·neo4j·rag·graphrag
干掉幻觉实战:如何构建企业级知识图谱增强 RAG本文约 7200 字,读完大约需要 18 分钟如果你在生产环境部署过 RAG 系统,一定踩过这样的坑:
摸鱼同学2 天前
ai·大模型·llm·token·claudecode
LLM 是什么?从 API 调用到 Token 机制别被"大语言模型"这个名字吓到。本质上,它就是一台"接话机器"——你给它一段文字,它预测最合理的下一段文字。真正重要的是理解 API 怎么调、Token 怎么算、参数怎么调。
小锋学长生活大爆炸2 天前
llm·agent·教程·科普·知识·培训·openclaw
【培训】Agent与OpenClaw转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~
Lkstar2 天前
程序员·llm·ai编程
高级提示技巧:Few-shot、Chain-of-Thought、自一致性——让大模型推理能力翻倍前言:之前聊了提示词设计的三大原则和 System/User Prompt 的分工,今天咱们就聊三个真正能显著提升模型推理能力的高级技巧——Few-shot(少样本学习)、Chain-of-Thought(思维链)、Self-Consistency(自一致性)。这三个技巧单独用就有效果,组合起来更是威力翻倍!
qq_白羊座2 天前
llm
DeepEval vs EvalScope 完整对比选型总结:测业务应用用 DeepEval;测底座大模型用 EvalScope表格python运行python
AlfredZhao2 天前
llm·vibecoding·氛围编程
AI编程系列01:裸 API 账单场景下,如何自建 LLM 用量可视化看板很多开发者接入聚合型 LLM API 后,会遇到一个很现实的问题:服务商只给账单接口,不提供 Web 管理后台。Token 消耗、扣费明细、成本趋势都藏在 JSON 里,看得见数据,却看不清变化。
CoderJia程序员甲2 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 周榜(2026-05-31)生成于:2026-05-31共发现热门项目: 19 个Token赞助:siliconflow本期 GitHub 热榜明显聚焦 AI Agent 工程化:从短视频生成、代码知识图谱、终端编程助手到插件生态与治理工具,热点已从“能用”转向“可控、可扩展、可复现”。 Claude Code、 Cursor、 Codex 等多端兼容成为共识,知识图谱、技能文件、Harness、治理沙箱、零信任身份等能力集中爆发,反映出开发者正在用标准化插件与工作流把大模型落地为生产级代码系统。
老A的AI实验室2 天前
人工智能·ai·llm·agi·genai
Cyber Weekly #665月28日,Anthropic宣布完成650亿美元的H轮融资,投后估值达到9650亿,正式超越OpenAI成为全球估值最高的AI公司,这也是该公司在IPO前的最后一轮大规模融资。同日,Anthropic发布了旗舰模型Claude Opus 4.8,新模型引入了"Dynamic Workflows"功能,能够自主管理多个子智能体协作完成复杂任务,并且在不确定性检测和主动风险识别方面有显著提升。据Reuters报道,Anthropic还将在未来数周内推出下一代模型Claude Mythos。此外,Anthro
AndrewHZ3 天前
人工智能·深度学习·语言模型·大模型·llm·transformer·编解码技术
【LLM技术全景】Transformer架构深度解析:Encoder-Decoder全理解摘要:本文是《LLM技术全景》系列第三篇。Transformer是现代大语言模型的基石架构——从GPT到LLaMA,从BERT到ChatGPT,无一例外都基于Transformer。本文将深入解析Transformer的核心组件:Self-Attention(自注意力)机制、多头注意力、位置编码,以及Encoder和Decoder的完整结构。通过配图和代码示例,帮助读者建立对Transformer架构的直观理解。无论你是想理解GPT为何能生成文本,还是想搞懂BERT如何做文本分类,这篇文章都是你的必读基础