llm

薛定谔的猫3692 小时前
ai·llm·agent·machine learning·architecture
LLM Agents: 从大语言模型到自主智能体的演进与架构解析随着大语言模型(LLM)能力的飞跃,AI 的角色正在发生根本性的变化。从单纯的“对话机器人”向具备自主决策、环境感知和工具调用能力的“智能代理(Agents)”演进,已成为当前人工智能研究的前沿阵地。本文将详细解析 LLM Agent 的核心架构及其工作机制。
冬奇Lab2 小时前
人工智能·llm
RAG 系列(一):大模型为什么需要「外挂记忆」用过大模型的人都遇到过这两种情况:情况一:知识截止情况二:幻觉这两个问题有同一个根源:大模型的知识被冻结在训练数据里了。
冬奇Lab2 小时前
人工智能·llm
一天一个开源项目(第86篇):VibeVoice —— 微软开源的前沿语音 AI,单次处理 90 分钟多说话人音频"语音是人类最自然的交流方式,而让机器真正'理解'并'生成'自然语音,是 AI 领域最难啃的硬骨头之一。"
Flynt7 小时前
llm
微软OpenAI终止独家合作:多云部署背后的技术架构变化事件速览4月27日,微软与OpenAI宣布终止排他性合作协议。这个消息在HN拿下了710评分,但圈内讨论更多是商业层面的分析。今天我们从技术架构角度拆解这次变化的影响。
量子位7 小时前
llm
银河通用LDA定义全域数据利用范式,跨本体世界动作大模型开启具身GPT-2时刻当下的具身智能赛道,已经卷成两大技术流派的拉锯战。纯 VLA 模型 Physical Intelligence π0.7 擅长举一反三,能适配陌生场景;世界模型派英伟达 DreamZero 主打「预判未来」,可零样本适配新机器人。
带娃的IT创业者7 小时前
开发语言·gpt·llm·php·高性能·成本优化·api网关
深度解析:从零构建高性能 LLM API 中转网关与成本优化实战前言: 在大模型技术日新月异的今天,开发者面临的挑战不再仅仅是“如何调用 API”,更多的是如何在保证服务质量(QoS)的前提下,极致压降调用成本。近期,社区热议的“物理机自建 API 中转”话题引发了广泛关注,尤其是关于“GPT-5.5 适配”与“0.065 超低倍率”的讨论。本文将抛开商业推广的迷雾,从技术架构、网络链路优化、成本模型分析及开发者集成四个维度,深入探讨如何构建企业级 LLM API 网关。
DigitalOcean8 小时前
llm·agent
DigitalOcean 打造 AI 原生云,帮助 AI 应用大幅降低成本与运维复杂度人工智能行业存在一个复合型的瓶颈,而这个瓶颈并非模型本身,而是推理。过去仅仅是一次模型调用,如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型,检索并合成数据,执行工具,并在生产环境中重复这一循环。这些不再是“无状态请求”,而是更像基础设施而非软件特性的动态系统。
熊猫钓鱼>_>8 小时前
人工智能·ai·架构·开源·大模型·llm·agent
大型复杂远程AI Agent应用:从架构困局到进化突围当AI Agent从本地玩具走向真实的生产环境,一个残酷的事实浮出水面:“智能”在远程、大规模、高复杂的场景下,往往会变成“智障”。 过去一年,我们在构建面向企业级的大型复杂远程AI Agent应用时,踩过无数坑,也沉淀了一些或许反直觉的经验。今天不聊空泛的概念,直接摊开讲讲:当你的Agent必须远程服务成千上万个并发任务,且每个任务都涉及多步推理、长上下文、工具调用甚至跨系统协作时,架构到底该怎么做?
bryant_meng9 小时前
人工智能·深度学习·llm·speculative·预言家
【Hung-yi Lee】《Introduction to Generative Artificial Intelligence》(11)Introduction to Generative AI 2024 Spring觉得现在语言模型还不够快吗?
白熊18811 小时前
人工智能·大模型·llm·agent·langgraph
【大模型Agent】基于LangGraph搭建 多轮对话客户支持机器人 项目示例需收集信息意图分类问候一般咨询订单问题投诉转人工有缺失信息信息齐全有缺失信息信息齐全触发中断人工确认后继续
Cosolar12 小时前
面试·架构·llm
大模型应用开发工程师面试指南——从入门到通关,拿下高薪OfferLLM面试题库☞ 大模型应用开发工程师面试指南2026年,AI大模型应用开发已成为技术圈最热门的转型方向,岗位缺口同比增速超10倍,高端岗位年薪可达百万级,成为无数开发者突破职业瓶颈、实现薪资跃迁的优选赛道。但与此同时,大模型面试的门槛也在持续提升——不再是简单考察编程基础,而是聚焦“原理理解+实战落地+工程优化”的综合能力,从Transformer架构到RAG系统设计,从Prompt工程到模型部署优化,从Agent开发到安全对齐,每一个环节都可能成为面试中的“拦路虎”。
山顶夕景14 小时前
大模型·llm·agent·智能体·openclaw
【Agent】Openclaw架构(Gateway|subagent|工具过滤|Sandbox)1、OpenClaw会用一组工作区 Markdown 文件定义 Agent 的默认身份与协作现场:这些文件并不都是以同样的方式进入一次 run。像 AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md 这类 bootstrap 文件,通常会进入 Project Context;BOOTSTRAP.md 只在 brand-new workspace 的首次引导时出现;MEMORY.md 现在也会作为长期记忆文件注入,而 memory/ 里的日
xiezhr15 小时前
人工智能·llm·openai
别被AI吓到了,一文看懂AI到底是啥?这两年,不管你刷朋友圈、刷视频、看新闻还是逛B站, "AI"两个字无处不在。ChatGPT能写文章,Midjourney能画画,Sora能做视频,Claude Code、OpenCode可以写代码,还有各种AI能做PPT、陪孩子练英语……
Irissgwe15 小时前
人工智能·langchain·llm·langgraph
LangChain之聊天模型核心能力(二)在 LangChain 中,聊天模型提供了额外的功能:结构化输出。一种使聊天模型以结构化格式(例如 JSON)进行响应的技术。
山顶夕景1 天前
大模型·llm·agent·线程·通信协议
【Agent】Claude code架构和源码粗读分析Layer 5 —— CLI / UI 层:负责命令行参数解析、终端渲染和用户交互。main.tsx 使用 Commander.js 定义了完整的 CLI 接口,REPL.tsx 提供交互式终端体验。SDK 入口则为程序化调用提供接口。
龙侠九重天1 天前
人工智能·ai·系统架构·大模型·llm·openclaw·hermes
OpenClaw 与 Hermes 有何异同?——从系统架构到用户体验的全面对比在过去几年间,AI 技术经历了从云端大模型到端侧智能体的范式跃迁。曾几何时,我们与 AI 的交互仅限于网页对话框,而如今,AI Agent——能够自主规划、执行和迭代的智能体——正在成为每个人桌面和手机上的新"同事"。
薛定谔的猫3691 天前
ai·llm·agent·技术趋势·mcp
深度解析 AI Agent 的未来:MCP 协议如何重塑大模型生态随着大语言模型(LLM)能力的提升,AI Agent 逐渐成为实现通用人工智能(AGI)的核心路径。然而,如何让 Agent 能够稳定、安全地访问外部工具和数据,成为了当前的技术瓶颈。本文将介绍 Model Context Protocol (MCP) 协议及其在生态构建中的关键作用。
Thanks_ks2 天前
自动化测试·大模型·llm·研发效能·模型微调·rag·提示词工程
从辅助编码到架构重塑:基于 LLM 的智能开发工作流落地实战在人工智能技术爆发的时代,AI 工具、大模型及行业应用正深刻改变开发者的工作模式与各领域的发展格局。从早期的单行代码补全,到如今的复杂逻辑推演、自动化测试生成,再到基于大模型的垂直行业解决方案,AI 已经不再仅仅是一个 “高级玩具”,而是正切实成为提升研发效能、驱动业务创新的核心引擎。
智泊AI2 天前
llm
AI Agent保姆级教程 | 从0~1构建一个属于你的AI Agent到现在为止,还没有一门完整的教程,能让任何人,包括你在内——从零开始,真正做出一个 AI Agent。所以我想试着把这件事做好。
loong_XL2 天前
llm·deepseek
deepseek接入claude code文档;claude code常用快捷键参考“https://api-docs.deepseek.com/zh-cn/guides/coding_agents”