llm

冼紫菜10 分钟前
后端·学习·ai·llm·agent·dify
Claude整理的Dify平台学习教程资源适合Java程序员的Dify学习路径指南整理日期:2026-02-17Dify 是一个开源的 LLM 应用开发平台,提供:
一个向上的运维者20 小时前
llm·gateway·istio·kserve
基于k8s的KServe 控制平面生产级部署最佳实践:基于 Gateway API 的标准化流量管理方案KServe控制平面负责管理推理服务的生命周期,与Kubernetes API协同工作,处理资源编排,并提供自动扩缩容能力。它作为KServe平台的核心,确保模型服务工作负载能够根据需求正确部署、监控和扩缩容。
山顶夕景21 小时前
大模型·llm·多模态·infra
【MLLM】Qwen3.5模型✦ 基于混合结构,397B总参/17B激活,能力匹配 >1T 参数的 Qwen3-Max; ✦ 原生多模态设计,同量级下多模态任务表现优于 Qwen3-VL; ✦ 覆盖 201 种语言; ✦ 在代码生成、智能体推理与多模态理解方面表现卓越;
XLYcmy1 天前
数据库·ai·llm·api·agent·幻觉·万方
智能体大赛 技术架构 数据根基层在构建面向学术研究的智能体系统过程中,我们始终将处理信息的准确性、时效性与安全性视为核心挑战。尤其在LLM的应用中,“幻觉”和知识更新的“时效性”不足,是影响其可靠性的关键瓶颈。为了从根本上破解这一难题,本项目在设计之初就确立了“以真实数据锚定智能推理”的架构原则,与权威学术数据库万方深度集成、多格式文档的统一解析与处理、以及严格的数据隐私保护机制,共同构成了系统可靠运行的“数据根基层”。
XLYcmy1 天前
数据库·ai·llm·prompt·知识图谱·agent·检索
智能体大赛 核心功能 可信文献检索与系统性知识梳理如图3-1所示,“智研星图”的核心功能围绕三个相互关联且层层递进的模块展开,共同构成了一个完整的研究闭环。
缘友一世1 天前
llm·conda·easy-r1
Conda 环境打包迁移完整指南:处理可编辑安装包(Editable Packages)conda-pack 无法打包可编辑安装的包(editable packages),报错:分离打包:环境依赖与源码分离
CoderJia程序员甲1 天前
大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-16)生成于:2026-02-16共发现热门项目: 11 个榜单类型:日榜本期GitHub趋势显示AI开发工具与高性能基础设施成为核心热点,Rust与TypeScript项目表现抢眼。具体来看,AI Agent领域持续爆发,开源AI助手和具备记忆的AI同事项目广受关注,而Chrome开发工具与AI的融合为智能编程提供了新范式。在基础设施层,轻量级向量数据库和高性能算法交易平台凸显了对速度与效率的极致追求。同时,边缘设备语音识别和WiFi姿态估计等技术创新展示了AI在现实场景的深入应用。这些项目共同指向一个趋势:
Tadas-Gao2 天前
驱动开发·架构·系统架构·大模型·llm·软件工程
基于规范驱动开发的下一代软件工程范式:从理论到实践在现代软件开发实践中,规范驱动开发(Spec Driven Development,SDD)作为一种新兴的工程方法论,正在重新定义软件系统的构建方式。本文将从历史演进、技术原理、实现案例等多个维度全面剖析SDD,揭示其如何通过形式化规范解决传统开发模式的痛点,并为大规模软件系统的可靠性提供新的解决方案。
Together_CZ2 天前
llm·语音识别·多模态·自然语言·asr·技术报告·index-asr
Index-ASR Technical Report——Index-ASR 技术报告这篇文章介绍了 Index-ASR,一个由哔哩哔哩团队开发的大规模、基于大语言模型(LLM)的自动语音识别(ASR)系统。其主要研究内容可概括为以下几点:
ZaneAI2 天前
llm·agent
🚀 Vercel AI SDK 使用指南: 消息元数据 (Message Metadata)在构建 AI 聊天应用时,我们经常需要传递一些不属于消息内容本身的额外信息。例如:Vercel AI SDK 提供了 Message Metadata(消息元数据) 功能来解决这个问题。它允许我们在消息级别(Message Level)附加自定义数据,这些数据不会作为 prompt 的一部分发送给大模型,而是专门用于 UI 展示或逻辑处理。
ZaneAI2 天前
llm·agent
🚀 Vercel AI SDK 使用指南:手动读取 UI 消息流 (Reading UI Message Streams)在 Vercel AI SDK 中,大家最熟悉的可能是在 React 前端使用的 useChat 或 useCompletion 钩子。但在某些场景下——比如开发一个终端聊天工具 (CLI Chatbot) 、在 Node.js 脚本中处理流、或者在 React Server Components (RSC) 中直接消费流——我们需要一种更底层的方式来读取和解析消息流。
utmhikari2 天前
ai·大模型·llm·agent·产品经理·稳定性·变更风险
【测试人生】LLMAgent在变更风险防控垂类应用的思考LLMAgent应用研发在当下是一个非常热门的话题,目前一个典型的趋势是,各类垂类领域都在思考LLMAgent如何能够代替人力,为其业务场景赋能,一方面是常规提效,另一方面是深度挖掘CornerCase。恰巧笔者最近在做变更风险防控领域LLMAgent应用的技术调研,所以今天这篇博客,也简单分享一下调研来的一些思考。
XLYcmy2 天前
人工智能·算法·机器学习·llm·prompt·agent·qwen
智能体大赛 技术架构 核心驱动层项目的技术核心在于系统化、多层次的Prompt工程策略,而非直接依赖模型微调。这一设计选择建立在我们对当前LLM技术特点及学术任务复杂性的深入理解之上。我们通过构建一套精密且可迭代的Prompt体系,将抽象、多阶段的学术任务——如主题聚类、知识体系构建、跨文献推理、方法比较等,分解为LLM能够稳定、可靠执行的一系列结构化子步骤。这种方法不仅在工程实践中显著降低了对庞大训练计算资源和标注数据的依赖,还极大地增强了系统的可控制性、可解释性与可扩展性,使我们能够通过持续优化Prompt结构、引入动态推理机制和实
智泊AI2 天前
llm
一文讲清:Agent、A2A、Skills和MCP的概念及区别AI Agent作为2026年AI生态系统的核心理念,指的是一种拥有自主决策、规划及执行能力的数字实体,其功能远超传统的问答或生成式AI,能够如同人类员工般应对复杂任务。
ZaneAI2 天前
llm·agent
🚀 Vercel AI SDK使用指南:错误处理 (Error Handling)在开发 AI 应用时,LLM(大语言模型)的不确定性是开发者必须面对的挑战。网络波动、配额限制(Rate Limits)、模型过载或输出内容被安全策略拦截,都可能导致请求失败。
ZaneAI2 天前
llm·agent
🚀 Vercel AI SDK 使用指南:生成式用户界面 (Generative UI)在构建 AI Chatbot 时,我们通常局限于纯文本的交互。用户询问天气,AI 返回一段文字:"旧金山今天是晴天,气温 20 度"。
ZaneAI3 天前
llm·agent
🚀 Vercel AI SDK 使用指南:图像生成 (Image Generation)在 AI 应用开发中,除了文本对话,图像生成也是一个非常热门的需求。Vercel AI SDK Core 在 v6 版本中提供了标准化的 generateImage 函数,让你能够用统一的 API 调用 DALL-E 3、Google Imagen、Midjourney (via Fal) 等多种顶级图像模型。
海棠AI实验室3 天前
llm·私有模型训练·私有大模型训练
第四章 文本数据清洗:去重、分段、规范化、脏词与格式纠错(先把数据“训得动”,再谈模型“训得好”)你做私训模型,最常见的幻觉是:“数据只要多就行。” 结果训出来:输出更像“复读机”、口径互相打架、离线评测虚高、上线直接翻车。
董厂长3 天前
人工智能·llm·rag·分块策略
RAG 中的分块策略(Chunking Strategy)检索增强生成(Retrieval-Augmented Generation, RAG)已经成为大语言模型应用中不可或缺的范式。它通过从外部知识库检索相关信息,辅助模型生成更准确、更及时的答案。然而,RAG 系统的性能高度依赖于一个关键步骤:如何将原始文档分割成合适的片段(chunks)以供检索。这就是“分块策略”(Chunking Strategy)要解决的问题。
爱听歌的周童鞋3 天前
llm·triton·assignment·flashattention·cs336·jit-compiler
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: FlashAttention-2本篇文章记录 CS336 作业 Assignment 2: Systems 中的 FlashAttention-2 作业要求,仅供自己参考😄