llm

山顶夕景5 小时前
大模型·llm·agent·线程·通信协议
【Agent】Claude code架构和源码粗读分析Layer 5 —— CLI / UI 层:负责命令行参数解析、终端渲染和用户交互。main.tsx 使用 Commander.js 定义了完整的 CLI 接口,REPL.tsx 提供交互式终端体验。SDK 入口则为程序化调用提供接口。
龙侠九重天8 小时前
人工智能·ai·系统架构·大模型·llm·openclaw·hermes
OpenClaw 与 Hermes 有何异同?——从系统架构到用户体验的全面对比在过去几年间,AI 技术经历了从云端大模型到端侧智能体的范式跃迁。曾几何时,我们与 AI 的交互仅限于网页对话框,而如今,AI Agent——能够自主规划、执行和迭代的智能体——正在成为每个人桌面和手机上的新"同事"。
薛定谔的猫36910 小时前
ai·llm·agent·技术趋势·mcp
深度解析 AI Agent 的未来:MCP 协议如何重塑大模型生态随着大语言模型(LLM)能力的提升,AI Agent 逐渐成为实现通用人工智能(AGI)的核心路径。然而,如何让 Agent 能够稳定、安全地访问外部工具和数据,成为了当前的技术瓶颈。本文将介绍 Model Context Protocol (MCP) 协议及其在生态构建中的关键作用。
Thanks_ks10 小时前
自动化测试·大模型·llm·研发效能·模型微调·rag·提示词工程
从辅助编码到架构重塑:基于 LLM 的智能开发工作流落地实战在人工智能技术爆发的时代,AI 工具、大模型及行业应用正深刻改变开发者的工作模式与各领域的发展格局。从早期的单行代码补全,到如今的复杂逻辑推演、自动化测试生成,再到基于大模型的垂直行业解决方案,AI 已经不再仅仅是一个 “高级玩具”,而是正切实成为提升研发效能、驱动业务创新的核心引擎。
智泊AI11 小时前
llm
AI Agent保姆级教程 | 从0~1构建一个属于你的AI Agent到现在为止,还没有一门完整的教程,能让任何人,包括你在内——从零开始,真正做出一个 AI Agent。所以我想试着把这件事做好。
loong_XL12 小时前
llm·deepseek
deepseek接入claude code文档;claude code常用快捷键参考“https://api-docs.deepseek.com/zh-cn/guides/coding_agents”
CoderJia程序员甲13 小时前
ai·大模型·llm·github
GitHub 热榜项目 - 日榜(2026-04-27)生成于:2026-04-27共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
龙侠九重天13 小时前
人工智能·ai·大模型·llm·agent·多智能体·multi-agent
什么是多 Agent 系统?——从单体 AI 到群体智能过去几年,AI 助手已经从实验室走向千家万户。从智能客服到代码辅助工具,从文档生成到数据分析,AI 正在重塑软件开发和业务运营的方方面面。ChatGPT、Claude、Cursor 等工具让开发者能够用自然语言描述需求,AI 随即生成代码、撰写文档、解释技术概念。
用户990193052451 天前
pytorch·llm
Nano-vLLM-MS:基于 nano-vLLM ,支持 MoE 模型和 Speculative Decoding项目地址这是一个基于 nano-vLLM 的轻量级 vLLM 实现,增强了对 MoE 模型和 Speculative Decoding(推测解码)的支持。
libokaifa1 天前
llm·agent·ai编程
Claude Code 的工程化落地:省 Token 篇用 Claude Code 干活,最直观的成本就是 token。跑一个复杂的代码审查 skill,上下文里塞满了各种规范文件,一轮对话下来几千 token 就没了——其中大半可能根本没用上。
RockHopper20251 天前
llm·语义驱动·运行语义
LLM 的“高概率合理性”vs“系统级可执行正确性”LLM(以 OpenAI 的模型体系为代表)本质是在做:给定上下文,生成条件概率最高的 token 序列
薛定谔的猫3691 天前
深度学习·ai·llm·machine learning·moe·deepseek
DeepSeek-V3 模型架构与训练技术深度解析随着大规模语言模型(LLM)技术的飞速发展,DeepSeek-V3 作为国产大模型领域的领军者,凭借其卓越的性能和极高的训练效率引起了广泛关注。本文旨在深入剖析 DeepSeek-V3 的底层架构设计,重点解析其如何通过优化混合专家模型(MoE)和创新性的训练策略,实现性能与成本的平衡。
.柒宇.1 天前
ai·langchain·llm·agent·rag
LangChain入门教程官网:https://www.langchain.com/ · 文档:https://python.langchain.com/docs · GitHub:https://github.com/langchain-ai/langchain
AIFrontiers1 天前
llm
transformer进阶之路:#1 整体概述原文链接:mp.weixin.qq.com/s/R3BxCMu5C…欢迎关注公gh: Al-Frontiers
Lazy_zheng1 天前
llm·openai·agent
用 Python 接入大模型 API:从 0 到 1 实现文本分类/抽取/匹配随着ChatGPT、通义千问等大语言模型的兴起,越来越多的开发者希望在自己的应用中集成AI能力,我决定通过实践来学习大模型API的调用方法。
薛定谔的猫3691 天前
ai·llm·agent·mcp·software engineering
基于 MCP (Model Context Protocol) 的智能 Agent 开发指南随着大语言模型 (LLM) 的快速发展,如何让 Agent 拥有更强的感知和行动能力成为了研究热点。Model Context Protocol (MCP) 作为一种旨在标准化 AI 与外部系统交互的协议,正在改变 Agent 的开发范式。本文将介绍 MCP 的基本原理、核心组件以及如何动手构建一个具备工具调用能力的智能 Agent。
Irissgwe2 天前
ai·langchain·llm·ai编程
LangChain快速上手LangChain 生态系统包含不同的包,用来准确选择要安装的功能。• 主 langchain 包 这个包是使用 LangChain 的起点,安装方式如下:
山顶夕景2 天前
python·大模型·llm·agent·多模态·vlm
【VLM】结合Python沙箱的以图思辨S1-VL模型【多模态推理大模型进展】基于Qwen3-VL-32B-Thinking做的面向数学、物理、化学、天文、地理、生物六大学科的科学多模态推理模型,主要特点是Python 沙箱执行图像裁剪、缩放、标注等代码,多轮迭代推理。S1-VL: Scientific Multimodal Reasoning Model with Thinking-with-Images,https://arxiv.org/pdf/2604.21409,https://huggingface.co/ScienceOne-AI,https:
深念Y2 天前
缓存·ai·llm·api·硬件·显存·kvcache
大模型API缓存的底层原理:从显存到网关最近和一位朋友聊到API的缓存,他提出了一个很敏锐的问题:“其实tokens缓存都是假的吧?LLM本身就是无状态的。这种缓存只是一种计费规则。实际上跟上下文显存空间有关,你来用,他那边就会给你开一个显存池,就是为了反复压缩切换。不可能你现在来一次,等下不来了,他还把你这份留着来压缩显存,开销太大了。”
冬奇Lab2 天前
人工智能·开源·llm
一天一个开源项目(第83篇):karpathy/autoresearch —— 开启 AI“自演化”实验室时代“这或许就是未来 AI 自主研发故事的起点。” —— Andrej Karpathy这是“一天一个开源项目”系列的第83篇文章。今天带你了解的项目是 karpathy/autoresearch(autoresearch)。