技术栈
llm
冬奇Lab
3 小时前
人工智能
·
langchain
·
llm
RAG 系列(二):用 LangChain 搭建你的第一个 RAG Pipeline
上一篇我们用手写 Python 搭了一个最小 RAG,100 行代码跑通了核心逻辑。但如果你想把那套代码搬到生产环境,很快就会撞上一堵墙。
薛定谔的猫369
9 小时前
ai
·
llm
·
agent
·
技术趋势
·
artificial intelligence
深度解析:大语言模型 (LLM) Agent 的架构与演进趋势
随着大语言模型 (LLM) 技术的爆发式增长,Agent(智能体)的概念成为了人工智能领域的研究热点。本文旨在详细解析 LLM Agent 的基本架构、核心组件以及其如何通过自主规划和工具使用实现复杂任务的自动化。
han_
9 小时前
前端
·
人工智能
·
llm
一篇看懂国内外主流大模型:GPT、Claude、Gemini、DeepSeek、通义千问有什么区别?
今天的大模型,可以先粗略理解成“特别聪明的输入法”。它不只是帮你补几个字,而是能读资料、写文章、看图片、写代码,甚至调用工具去完成一整件事。
Flynt
12 小时前
llm
在K8s上部署vLLM的完整踩坑记录
我们公司上个月把LLM推理服务迁移到了K8s+vLLM,跑了一个月,整体稳定。这篇文章记录一下我们踩过的坑,给想上车的朋友一些参考。
赵康
13 小时前
ai
·
llm
智人曾经这样灭绝猛犸象:AI入侵与行业灭绝
冰河时代绵延了将近十万年。在它最后的尾声,全球气温以人类感知不到的速度缓慢上升。冰川退缩,海平面以每百年几厘米的节奏爬升。一条曾经宽达数百公里、将亚洲与北美洲连为一体的陆地走廊,在几千年里悄悄沉入水下,从地图上永远消失——这就是白令陆桥。
abigale03
14 小时前
langchain
·
llm
·
prompt
·
agent
·
rag
·
lcel
LangChain:自定义模型・RAG 检索・Agent 原理笔记
项目文件夹:llmsLangChain开发入门教程::llms/langchain_tutorialLLM训练:llms/train
alwaysrun
16 小时前
人工智能
·
llm
LLM发展历程与自注意力简介
从 Transformer 诞生至今,LLM发展日新月异, 经历“规模(Scaling)”、“对齐(Alignment)”、“推理(Reasoning)”及“智能体(Agentic)” 等多维度的技术跨越。
GoAI
16 小时前
人工智能
·
深度学习
·
大模型
·
llm
·
agent
《深入浅出Agent》:项目深度解析Autoresearch
项目地址: https://github.com/karpathy/autoresearch 作者: Andrej Karpathy(前 Tesla AI 总监、OpenAI 创始成员、Stanford PhD) 发布时间: 2026 年 3 月 开源协议: MIT License
卷Java
17 小时前
javascript
·
react.js
·
大模型
·
llm
·
ecmascript
·
multi-agent
ReAct范式实战:让Agent学会边想边做
说实话,我第一次看到ReAct这个论文标题的时候,内心是拒绝的。"又是个学术界造的概念吧?"我当时想。
卷Java
17 小时前
大模型
·
llm
·
multi-agent
·
agent协作
Multi-Agent系统实战:如何让多个Agent握手协作
前两天折腾 Multi-Agent,三个 Agent 在那里互踢皮球,一个说"让 B 去处理",另一个说"这不归我管",场面一度非常尴尬。
薛定谔的猫369
1 天前
ai
·
llm
·
agent
·
machine learning
·
architecture
LLM Agents: 从大语言模型到自主智能体的演进与架构解析
随着大语言模型(LLM)能力的飞跃,AI 的角色正在发生根本性的变化。从单纯的“对话机器人”向具备自主决策、环境感知和工具调用能力的“智能代理(Agents)”演进,已成为当前人工智能研究的前沿阵地。本文将详细解析 LLM Agent 的核心架构及其工作机制。
冬奇Lab
1 天前
人工智能
·
llm
RAG 系列(一):大模型为什么需要「外挂记忆」
用过大模型的人都遇到过这两种情况:情况一:知识截止情况二:幻觉这两个问题有同一个根源:大模型的知识被冻结在训练数据里了。
冬奇Lab
1 天前
人工智能
·
llm
一天一个开源项目(第86篇):VibeVoice —— 微软开源的前沿语音 AI,单次处理 90 分钟多说话人音频
"语音是人类最自然的交流方式,而让机器真正'理解'并'生成'自然语音,是 AI 领域最难啃的硬骨头之一。"
Flynt
1 天前
llm
微软OpenAI终止独家合作:多云部署背后的技术架构变化
事件速览4月27日,微软与OpenAI宣布终止排他性合作协议。这个消息在HN拿下了710评分,但圈内讨论更多是商业层面的分析。今天我们从技术架构角度拆解这次变化的影响。
量子位
1 天前
llm
银河通用LDA定义全域数据利用范式,跨本体世界动作大模型开启具身GPT-2时刻
当下的具身智能赛道,已经卷成两大技术流派的拉锯战。纯 VLA 模型 Physical Intelligence π0.7 擅长举一反三,能适配陌生场景;世界模型派英伟达 DreamZero 主打「预判未来」,可零样本适配新机器人。
带娃的IT创业者
1 天前
开发语言
·
gpt
·
llm
·
php
·
高性能
·
成本优化
·
api网关
深度解析:从零构建高性能 LLM API 中转网关与成本优化实战
前言: 在大模型技术日新月异的今天,开发者面临的挑战不再仅仅是“如何调用 API”,更多的是如何在保证服务质量(QoS)的前提下,极致压降调用成本。近期,社区热议的“物理机自建 API 中转”话题引发了广泛关注,尤其是关于“GPT-5.5 适配”与“0.065 超低倍率”的讨论。本文将抛开商业推广的迷雾,从技术架构、网络链路优化、成本模型分析及开发者集成四个维度,深入探讨如何构建企业级 LLM API 网关。
DigitalOcean
1 天前
llm
·
agent
DigitalOcean 打造 AI 原生云,帮助 AI 应用大幅降低成本与运维复杂度
人工智能行业存在一个复合型的瓶颈,而这个瓶颈并非模型本身,而是推理。过去仅仅是一次模型调用,如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型,检索并合成数据,执行工具,并在生产环境中重复这一循环。这些不再是“无状态请求”,而是更像基础设施而非软件特性的动态系统。
熊猫钓鱼>_>
1 天前
人工智能
·
ai
·
架构
·
开源
·
大模型
·
llm
·
agent
大型复杂远程AI Agent应用:从架构困局到进化突围
当AI Agent从本地玩具走向真实的生产环境,一个残酷的事实浮出水面:“智能”在远程、大规模、高复杂的场景下,往往会变成“智障”。 过去一年,我们在构建面向企业级的大型复杂远程AI Agent应用时,踩过无数坑,也沉淀了一些或许反直觉的经验。今天不聊空泛的概念,直接摊开讲讲:当你的Agent必须远程服务成千上万个并发任务,且每个任务都涉及多步推理、长上下文、工具调用甚至跨系统协作时,架构到底该怎么做?