llm

CoderJia程序员甲39 分钟前
大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-16)生成于:2026-02-16共发现热门项目: 11 个榜单类型:日榜本期GitHub趋势显示AI开发工具与高性能基础设施成为核心热点,Rust与TypeScript项目表现抢眼。具体来看,AI Agent领域持续爆发,开源AI助手和具备记忆的AI同事项目广受关注,而Chrome开发工具与AI的融合为智能编程提供了新范式。在基础设施层,轻量级向量数据库和高性能算法交易平台凸显了对速度与效率的极致追求。同时,边缘设备语音识别和WiFi姿态估计等技术创新展示了AI在现实场景的深入应用。这些项目共同指向一个趋势:
Tadas-Gao17 小时前
驱动开发·架构·系统架构·大模型·llm·软件工程
基于规范驱动开发的下一代软件工程范式:从理论到实践在现代软件开发实践中,规范驱动开发(Spec Driven Development,SDD)作为一种新兴的工程方法论,正在重新定义软件系统的构建方式。本文将从历史演进、技术原理、实现案例等多个维度全面剖析SDD,揭示其如何通过形式化规范解决传统开发模式的痛点,并为大规模软件系统的可靠性提供新的解决方案。
Together_CZ18 小时前
llm·语音识别·多模态·自然语言·asr·技术报告·index-asr
Index-ASR Technical Report——Index-ASR 技术报告这篇文章介绍了 Index-ASR,一个由哔哩哔哩团队开发的大规模、基于大语言模型(LLM)的自动语音识别(ASR)系统。其主要研究内容可概括为以下几点:
ZaneAI1 天前
llm·agent
🚀 Vercel AI SDK 使用指南: 消息元数据 (Message Metadata)在构建 AI 聊天应用时,我们经常需要传递一些不属于消息内容本身的额外信息。例如:Vercel AI SDK 提供了 Message Metadata(消息元数据) 功能来解决这个问题。它允许我们在消息级别(Message Level)附加自定义数据,这些数据不会作为 prompt 的一部分发送给大模型,而是专门用于 UI 展示或逻辑处理。
ZaneAI1 天前
llm·agent
🚀 Vercel AI SDK 使用指南:手动读取 UI 消息流 (Reading UI Message Streams)在 Vercel AI SDK 中,大家最熟悉的可能是在 React 前端使用的 useChat 或 useCompletion 钩子。但在某些场景下——比如开发一个终端聊天工具 (CLI Chatbot) 、在 Node.js 脚本中处理流、或者在 React Server Components (RSC) 中直接消费流——我们需要一种更底层的方式来读取和解析消息流。
utmhikari1 天前
ai·大模型·llm·agent·产品经理·稳定性·变更风险
【测试人生】LLMAgent在变更风险防控垂类应用的思考LLMAgent应用研发在当下是一个非常热门的话题,目前一个典型的趋势是,各类垂类领域都在思考LLMAgent如何能够代替人力,为其业务场景赋能,一方面是常规提效,另一方面是深度挖掘CornerCase。恰巧笔者最近在做变更风险防控领域LLMAgent应用的技术调研,所以今天这篇博客,也简单分享一下调研来的一些思考。
XLYcmy1 天前
人工智能·算法·机器学习·llm·prompt·agent·qwen
智能体大赛 技术架构 核心驱动层项目的技术核心在于系统化、多层次的Prompt工程策略,而非直接依赖模型微调。这一设计选择建立在我们对当前LLM技术特点及学术任务复杂性的深入理解之上。我们通过构建一套精密且可迭代的Prompt体系,将抽象、多阶段的学术任务——如主题聚类、知识体系构建、跨文献推理、方法比较等,分解为LLM能够稳定、可靠执行的一系列结构化子步骤。这种方法不仅在工程实践中显著降低了对庞大训练计算资源和标注数据的依赖,还极大地增强了系统的可控制性、可解释性与可扩展性,使我们能够通过持续优化Prompt结构、引入动态推理机制和实
智泊AI1 天前
llm
一文讲清:Agent、A2A、Skills和MCP的概念及区别AI Agent作为2026年AI生态系统的核心理念,指的是一种拥有自主决策、规划及执行能力的数字实体,其功能远超传统的问答或生成式AI,能够如同人类员工般应对复杂任务。
ZaneAI1 天前
llm·agent
🚀 Vercel AI SDK使用指南:错误处理 (Error Handling)在开发 AI 应用时,LLM(大语言模型)的不确定性是开发者必须面对的挑战。网络波动、配额限制(Rate Limits)、模型过载或输出内容被安全策略拦截,都可能导致请求失败。
ZaneAI1 天前
llm·agent
🚀 Vercel AI SDK 使用指南:生成式用户界面 (Generative UI)在构建 AI Chatbot 时,我们通常局限于纯文本的交互。用户询问天气,AI 返回一段文字:"旧金山今天是晴天,气温 20 度"。
ZaneAI2 天前
llm·agent
🚀 Vercel AI SDK 使用指南:图像生成 (Image Generation)在 AI 应用开发中,除了文本对话,图像生成也是一个非常热门的需求。Vercel AI SDK Core 在 v6 版本中提供了标准化的 generateImage 函数,让你能够用统一的 API 调用 DALL-E 3、Google Imagen、Midjourney (via Fal) 等多种顶级图像模型。
海棠AI实验室2 天前
llm·私有模型训练·私有大模型训练
第四章 文本数据清洗:去重、分段、规范化、脏词与格式纠错(先把数据“训得动”,再谈模型“训得好”)你做私训模型,最常见的幻觉是:“数据只要多就行。” 结果训出来:输出更像“复读机”、口径互相打架、离线评测虚高、上线直接翻车。
董厂长2 天前
人工智能·llm·rag·分块策略
RAG 中的分块策略(Chunking Strategy)检索增强生成(Retrieval-Augmented Generation, RAG)已经成为大语言模型应用中不可或缺的范式。它通过从外部知识库检索相关信息,辅助模型生成更准确、更及时的答案。然而,RAG 系统的性能高度依赖于一个关键步骤:如何将原始文档分割成合适的片段(chunks)以供检索。这就是“分块策略”(Chunking Strategy)要解决的问题。
爱听歌的周童鞋2 天前
llm·triton·assignment·flashattention·cs336·jit-compiler
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Assignment 2: FlashAttention-2本篇文章记录 CS336 作业 Assignment 2: Systems 中的 FlashAttention-2 作业要求,仅供自己参考😄
_Johnny_2 天前
llm·cliproxyapi
LLM模型多AI服务 API 接口兼容 CLIProxyAPICLIProxyAPI项目是一个为 CLI 提供 OpenAI/Gemini/Claude/Codex 兼容 API 接口的代理服务器。
Asher阿舍技术站2 天前
人工智能·学习·llm
【AI基础学习系列】三、LLM基础知识大语言模型(Large Language Model,LLM)是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数,旨在理解和生成人类语言。LLM的工作原理是将输入文本拆分成最小语义单元(Token),去预测文本的下一个词的生成概率,并选择概率最大的词汇。并不断循环这个过程,直至出现阶数标识或达到队列最大长度。
山顶夕景3 天前
llm·多模态·图生文
【MLLM】科学领域Innovator-VL多模态模型【科学领域多模态大模型进展】之前讲过interns1多模态模型,这个系列继续看一个新的模型Innovator-VL: A Multimodal Large Language Model for Scientific Discovery,https://arxiv.org/pdf/2601.19325,Homepage: https://InnovatorLM.github.io/Innovator-VL,Github: https://InnovatorLM/Innovator-VL,Instruct M
Baihai IDP3 天前
人工智能·ai·llm
Prompt caching 技术是如何实现 1 折的推理成本优化的?编者按: 你是否曾好奇过,那些声称能将长文本输入成本降低90%、延迟减少85%的"Prompt Caching"技术,背后究竟缓存了什么?是简单的文本复用,还是某种更深层的计算优化?
德育处主任3 天前
人工智能·llm·aigc
『n8n』让大模型识别图片内容点赞 + 关注 + 收藏 = 学会了整理了一个n8n小专栏,有兴趣的工友可以关注一下 👉 《n8n修炼手册》
spencer_tseng3 天前
ai·llm
Break the Sequential Dependency of LLM Inference Using Lookahead DecodingBreak the Sequential Dependency of LLM Inference Using Lookahead Decoding