llm

农场主John3 小时前
pytorch·llm·deepspeed
Accelerate_deepspeed使用执行完accelerate config会有一个默认的yaml配置文件
组合缺一4 小时前
java·人工智能·分布式·llm·mcp·skills
论 AI Skills 分布式发展的必然性:从单体智能到“云端大脑”的跃迁在人工智能从“对话式模型”向“原生智能体(Agentic AI)”进化的进程中,我们正处于一个类似于互联网从单机软件向分布式架构转型的关键拐点。这一转型的核心,在于 AI Skills 的崛起及其分布式发展的必然。
小哈里4 小时前
人工智能·大模型·llm·分布式计算·ray
【计算】Ray框架介绍,AI基础设施之“通用”分布式计算(跨场景,门槛低,大规模生产,单机->集群->推理一站式)【计算】Ray框架介绍,AI基础设施之“通用”分布式计算(跨场景,门槛低,大规模生产,单机->集群->推理一站式)
山顶夕景20 小时前
大模型·llm·ocr·多模态
【VLM】Visual Merit or Linguistic Crutch? 看DeepSeek-OCR《Visual Merit or Linguistic Crutch? A Close Look at DeepSeek-OCR》,https://arxiv.org/pdf/2601.03714,相关实验数据在https://anonymous.4open.science/r/ACL26-84B5/Readme.md
玄同76520 小时前
人工智能·python·语言模型·langchain·llm·nlp·知识图谱
LangChain 核心组件全解析:构建大模型应用的 “乐高积木”【个人主页:玄同765】大语言模型(LLM)开发工程师|中国传媒大学·数字媒体技术(智能交互与游戏设计)
亚里随笔1 天前
人工智能·深度学习·机器学习·llm·agentic·rlvr
相对优势估计存在偏差——揭示群体相对强化学习中的系统性偏差问题在大型语言模型的后训练时代,强化学习从验证者奖励(RLVR)已成为提升模型推理能力的核心范式。以GRPO为代表的群体相对算法因其无需训练评判网络的简洁设计而备受青睐。然而,本文揭示了这一方法中一个被长期忽视的根本性问题:群体相对优势估计存在系统性偏差。本文不仅提供了首个理论分析,证明该估计器对困难问题会系统性低估优势、对简单问题会过度估计优势,还提出了基于历史感知的自适应难度加权(HA-DW)方案来纠正这一偏差。实验表明,该方法在多个数学推理基准上持续提升性能,为RLVR训练提供了新的理论见解和实践指导。
带刺的坐椅1 天前
java·ai·llm·mcp·tool-call·skills
论 AI Skills 分布式发展的必然性:从单体智能到“云端大脑”的跃迁在人工智能从“对话式模型”向“原生智能体(Agentic AI)”进化的进程中,我们正处于一个类似于互联网从单机软件向分布式架构转型的关键拐点。这一转型的核心,在于 AI Skills 的崛起及其分布式发展的必然。
中杯可乐多加冰1 天前
人工智能·深度学习·大模型·llm·知识库·rag·graphrag
RAG 深度实践系列(三):RAG 技术演变与核心架构的深度剖析检索增强生成(RAG)技术的发展史,是一部不断挑战大型语言模型(LLM)局限性、追求系统级智能的演进史。RAG 的演变并非简单的功能叠加,而是对“如何高效、可靠地将外部知识融入 LLM 推理过程”这一核心问题的持续探索。我们可以将 RAG 的演进脉络划分为四个清晰的阶段:Naive RAG 确立基本范式,Advanced RAG 聚焦精细化优化,Modular RAG 追求架构灵活性,最终 Agentic RAG 实现自主决策与智能化。
Wilber的技术分享1 天前
人工智能·笔记·深度学习·llm·transformer
【Transformer原理详解2】Decoder结构解析、Decoder-Only结构中的DecoderDecoder结构是Transformer中至关重要的结构,这不仅仅是因为Decoder是专门设计用来处理输出序列生成的结构,更是因为Decoder的用法非常灵活并且复杂。在之前Encoder的课程中,我们讲解了数个Encoder-Only结构的使用场景,在Transformer丰富的用法中,我们还可以选择使用按照完整的encoder+decoder结构、或者Decoder-Only架构——
猿小羽2 天前
ai·llm·mlops·rag·vector database·spring ai·prompt engineering
AI 2.0 时代全栈开发实战:从 Spring AI 到 MLOps 的进阶指南随着生成式 AI 的爆发,开发者正面临从“传统开发”向“AI 原生开发”的转型。本系列文章旨在通过实战导向,带你深度掌握 AI 应用开发的核心技术栈。
猿小羽2 天前
java·spring boot·llm·agent·spring ai·mcp·model context protocol
AI 学习与实战系列:Spring AI + MCP 深度实战——构建标准化、可扩展的智能 Agent 系统在人工智能应用爆发的今天,开发者面临的最大挑战之一已不再是单纯的模型调用,而是如何让模型“理解”并“操作”企业内部纷繁复杂的业务数据与工具系统。早期的 AI 集成往往是“烟囱式”的:为每一个特定的工具编写专属的适配器,为每一种数据源编写复杂的清洗逻辑。这种做法在 Agent(智能体)规模扩大时,会导致代码难以维护、扩展性极差。
视觉&物联智能2 天前
人工智能·安全·llm·aigc·agi·智能体
【杂谈】-2026年人工智能发展趋势:智能体崛起、行业洗牌与安全挑战所有关键趋势都指向同一个方向:人工智能不再仅仅是工具,而是正在成为支撑现代企业运行的基础设施。当前,“智能体人工智能”(Agentic AI)正成为重塑行业格局的核心趋势之一。它已不再是简单的辅助工具,而是逐步演变为大型企业广泛采用的企业级解决方案。这是继传统大语言模型(LLM)用于文本生成、数据分析等标准化任务之后,AI发展的下一阶段。
猿小羽2 天前
java·大模型·llm·ai agent·spring ai·开发者工具·mcp
深度实战:Spring AI 与 MCP(Model Context Protocol)构建下一代 AI Agent在过去的两年中,生成式 AI(AIGC)经历了从单纯的“聊天对话”向“自主决策”的跨越式发展。早期的 LLM 只是一个庞大的知识库,它能吟诗作对,却无法感知实时世界,也无法操作具体的软件工具。为了解决这一局限性,AI Agent(智能体)的概念应运而生。Agent 的核心在于其“行动能力”,即通过 Tool Calling(工具调用)机制,连接数据库、API 和本地文件系统。
勇气要爆发2 天前
人工智能·gpt·机器学习·llm·微调·多模态·预训练
【AI扫盲】大模型(LLM)原理详解:从 DeepSeek 到 GPT-5 全面解析 (2026最新版)难度:⭐⭐ 关键词:LLM, 参数, 预训练, 微调, 多模态, DeepSeek大家好,我是飞哥!👋
猿小羽2 天前
java·spring boot·llm·agent·spring ai·mcp·artificial intelligence
Spring AI + MCP 实战:构建企业级 Agent 生态的基石在人工智能技术飞速发展的当下,我们已经从最初的“对话式 AI”迈向了“代理式 AI (Agentic AI)”的新阶段。早期的 AI 应用主要依赖于 Prompt Engineering,通过精巧的提示词引导模型输出。然而,随着企业级需求的复杂化,模型需要能够直接访问实时数据、操作外部工具并进行多步推理。这种需求催生了 LangChain、AutoGPT 等框架的兴起。
猿小羽2 天前
java·spring boot·llm·ai agent·spring ai·mcp·model context protocol
Spring AI + MCP 实战:构建下一代智能 Agent 应用在人工智能技术飞速发展的今天,我们正经历着从“对话式 AI”向“代理式 AI(Agentic AI)”的重大范式转移。早期的 LLM 应用大多局限于简单的问答(RAG 或直接对话),用户输入 Prompt,模型输出文本。然而,这种模式存在一个致命的弱点:模型被困在了“数字真空”中,无法感知实时数据,也无法对真实世界产生物理影响。
猿小羽2 天前
java·spring boot·llm·架构设计·ai agent·spring ai·mcp
Spring AI + MCP 实战:构建标准化、可扩展的 AI Agent 架构体系在生成式 AI 爆发的初期,开发者主要关注的是如何通过 Prompt Engineering 调用大模型(LLM)的 API。然而,随着应用场景的深入,我们发现单纯的“对话”远不能满足业务需求。AI 必须能够感知外部世界、操作外部工具,这就是所谓的 AI Agent(智能体)。
德育处主任Pro2 天前
llm·aigc·deepseek·n8n
『n8n』让AI长记性点赞 + 关注 + 收藏 = 学会了整理了一个n8n小专栏,有兴趣的工友可以关注一下 👉 《n8n修炼手册》
小Pawn爷2 天前
python·llm
6.本地安装Fingpt本地环境Python 3.10CUbDA (可选)PyTorch云环境-魔塔DeepSeek R1安装FinGPT Python依赖包
猿小羽2 天前
java·spring boot·llm·ai agent·spring ai·anthropic·mcp
Spring AI + MCP 实战:构建标准化 AI 智能代理与上下文集成在人工智能技术浪潮中,大语言模型(LLM)的演进已经从单纯的“聊天对话”进化到了“智能代理(Agent)”阶段。早期的 AI 应用开发往往陷入一种“胶水代码”的泥潭:开发者需要为每一个外部工具、每一份私有文档编写繁琐的适配器代码。随着 Anthropic 发布了 Model Context Protocol(MCP,模型上下文协议),这一局面正在发生根本性的变化。对于广大 Java 开发者而言,Spring AI 框架敏锐地捕捉到了这一趋势,通过深度集成 MCP,为构建标准化、可扩展的 AI 应用提供了坚