大模型

熊猫钓鱼>_>18 分钟前
人工智能·ai·架构·开源·大模型·llm·agent
大型复杂远程AI Agent应用:从架构困局到进化突围当AI Agent从本地玩具走向真实的生产环境,一个残酷的事实浮出水面:“智能”在远程、大规模、高复杂的场景下,往往会变成“智障”。 过去一年,我们在构建面向企业级的大型复杂远程AI Agent应用时,踩过无数坑,也沉淀了一些或许反直觉的经验。今天不聊空泛的概念,直接摊开讲讲:当你的Agent必须远程服务成千上万个并发任务,且每个任务都涉及多步推理、长上下文、工具调用甚至跨系统协作时,架构到底该怎么做?
xixixi777772 小时前
人工智能·安全·ai·大模型·aigc·量子计算·供应链
AI安全周记:AI驱动攻击占比50%、PQC国标落地、ShinyHunters连环袭击——面对1:25的攻防成本鸿沟,防守方还能撑多久?当AI驱动网络攻击占比突破50%,当“先窃取、后解密”从理论变为现实,当影子AI将不安全代码扩散率推高300%——这已不是传统的“攻防”,而是一场成本完全不对等的降维打击。
白熊1882 小时前
人工智能·大模型·llm·agent·langgraph
【大模型Agent】基于LangGraph搭建 多轮对话客户支持机器人 项目示例需收集信息意图分类问候一般咨询订单问题投诉转人工有缺失信息信息齐全有缺失信息信息齐全触发中断人工确认后继续
ACCELERATOR_LLC4 小时前
人工智能·深度学习·大模型·强化学习·模型训练
【DataWhale组队学习】DIY-LLM Task5 大模型的基本训练流程原文链接这一章讲的是大模型如何从底座模型变得可用。 原文说,本章重点是 SFT(监督微调),预训练和强化学习主要是总览,强化学习细节会放到下一章,不过Datawhale的组队学习没有下一章。
山顶夕景6 小时前
大模型·llm·agent·智能体·openclaw
【Agent】Openclaw架构(Gateway|subagent|工具过滤|Sandbox)1、OpenClaw会用一组工作区 Markdown 文件定义 Agent 的默认身份与协作现场:这些文件并不都是以同样的方式进入一次 run。像 AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md 这类 bootstrap 文件,通常会进入 Project Context;BOOTSTRAP.md 只在 brand-new workspace 的首次引导时出现;MEMORY.md 现在也会作为长期记忆文件注入,而 memory/ 里的日
Flying pigs~~7 小时前
人工智能·大模型·微调·prompt
大模型Prompt-Tuning技术详解:从入门到进阶一文读懂NLP范式演进、Fine-Tuning与Prompt-Tuning的核心原理随着ChatGPT、GPT-4等大模型的爆火,Prompt-Tuning技术逐渐成为学术界和工业界关注的焦点。本文将系统介绍NLP任务的四种发展范式,深入剖析Fine-Tuning和Prompt-Tuning的核心原理,并带你了解面向超大规模模型的先进微调技术。
山顶夕景1 天前
大模型·llm·agent·线程·通信协议
【Agent】Claude code架构和源码粗读分析Layer 5 —— CLI / UI 层:负责命令行参数解析、终端渲染和用户交互。main.tsx 使用 Commander.js 定义了完整的 CLI 接口,REPL.tsx 提供交互式终端体验。SDK 入口则为程序化调用提供接口。
龙侠九重天1 天前
人工智能·ai·系统架构·大模型·llm·openclaw·hermes
OpenClaw 与 Hermes 有何异同?——从系统架构到用户体验的全面对比在过去几年间,AI 技术经历了从云端大模型到端侧智能体的范式跃迁。曾几何时,我们与 AI 的交互仅限于网页对话框,而如今,AI Agent——能够自主规划、执行和迭代的智能体——正在成为每个人桌面和手机上的新"同事"。
山林竹笋1 天前
人工智能·大模型·ai编程·技术趋势
人工智能领域开源TOP20项目(2026.04.20-2026.04.26)
是Yu欸1 天前
android·数据库·大模型·github·昇腾·sglang·qwen3
SGLang 推理服务基础性能评测版权声明:本文为原创,遵循 CC 4.0 BY-SA 协议。转载请注明出处。SGLang 推理服务基础性能评测
guslegend1 天前
人工智能·大模型·rag
第17节:模型忽略关键实体怎么办?注意力权重分配机制引导生成拒绝重点RAG与Agent性能调优:17.模型忽略关键实体怎么办?注意力权重分配机制引导生成拒绝重点Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Thanks_ks1 天前
自动化测试·大模型·llm·研发效能·模型微调·rag·提示词工程
从辅助编码到架构重塑:基于 LLM 的智能开发工作流落地实战在人工智能技术爆发的时代,AI 工具、大模型及行业应用正深刻改变开发者的工作模式与各领域的发展格局。从早期的单行代码补全,到如今的复杂逻辑推演、自动化测试生成,再到基于大模型的垂直行业解决方案,AI 已经不再仅仅是一个 “高级玩具”,而是正切实成为提升研发效能、驱动业务创新的核心引擎。
Luca_kill1 天前
大模型·moe·deepseek·ai架构·v4·混合注意力·流形约束
深度拆解 DeepSeek V4:混合注意力 + 流形约束超连接如何重塑万亿 MoE 架构2026 年 4 月 24 日,DeepSeek V4 预览版正式发布,同步开源了 V4-Pro(总参数 1.6 万亿,激活 490 亿)和 V4-Flash(总参数 2840 亿,激活 130 亿)两个版本。这组数据本身已经足够震撼,但更让技术圈沸腾的是它交出的成绩单:
CoderJia程序员甲1 天前
ai·大模型·llm·github
GitHub 热榜项目 - 日榜(2026-04-27)生成于:2026-04-27共发现热门项目: 13 个榜单类型:日榜Token赞助:siliconflow
龙侠九重天1 天前
人工智能·ai·大模型·llm·agent·多智能体·multi-agent
什么是多 Agent 系统?——从单体 AI 到群体智能过去几年,AI 助手已经从实验室走向千家万户。从智能客服到代码辅助工具,从文档生成到数据分析,AI 正在重塑软件开发和业务运营的方方面面。ChatGPT、Claude、Cursor 等工具让开发者能够用自然语言描述需求,AI 随即生成代码、撰写文档、解释技术概念。
New_Horizons6662 天前
大模型·claude code
Claude Code的安装和使用(Win10)整体是 TypeScript + Node.js 项目,采用模块化架构,你可以把它理解为:大脑(agent) + 工具链(tools) + 界面(ui) + 共享逻辑(shared)。
GPUStack2 天前
大模型·ascend·模型推理·deepseek·gpustack
Day 0 部署:昇腾 910B DeepSeek-V4 部署指南与压测表现随着 DeepSeek 正式发布 DeepSeek-V4 系列,大模型的工程边界再次被明显推高。该系列基于 MoE 架构,提供了 DeepSeek-V4-Flash 284B 和 DeepSeek-V4-Pro 1.6T 两种规格,同时在推理阶段仅激活数十亿参数,在性能与成本之间取得了新的平衡。配合百万级上下文窗口与全新的注意力优化机制,其在长文本理解、复杂推理以及智能体任务中的表现,已经开始逼近甚至挑战当前主流闭源模型。
庄小焱2 天前
大模型·rag·ai模型·模型结果格式化
【AI模型】——RAG格式集成本文系统介绍了大语言模型格式化生成技术,涵盖Output Parsers、LlamaIndex结构化输出、提示工程技巧及Function Calling等核心方法,并对比了提示词约束、JSON模式、控制生成等RAG场景下的格式优化实现路径。
AVA洋2 天前
人工智能·python·大模型
初识Coze(扣子)工作流,ai视频自动化制作Coze 工作流是字节跳动 Coze 平台的可视化、低代码 AI 流程编排工具,核心是用拖拽节点的方式,把大模型、插件、代码、判断逻辑等能力串成完整任务链,快速做复杂 AI 应用Coze Plus。