llm

Pitayafruit6 小时前
spring boot·后端·llm
Spring AI 进阶之路05:集成 MCP 协议实现工具调用在上一篇文章中,我们通过集成 SearXNG,成功让大模型“睁眼看世界”,具备了获取互联网实时信息的能力。然而,无论是 RAG(检索增强生成)还是联网搜索,本质上都是让 AI “读” 更多的书,获取更多的信息。但一个真正的智能助手,不仅要能“读”,还要能 “写” 和 “做”。
ASS-ASH10 小时前
人工智能·python·llm·多模态·qwen·视觉语言模型·vlm
视觉语言大模型Qwen3-VL-8B-Instruct概述通义千问3-VL-8B-Instruct是阿里巴巴通义千问团队于2025年10月15日发布的开源视觉语言模型,参数规模为80亿 [6] 。该模型基于Dense架构设计,通过三项核心技术创新实现了视觉与语言能力的平衡发展:交错MRoPE多维位置编码、DeepStack特征融合技术和文本-时间戳对齐机制 [5] 。在32项核心评测指标中,该模型超越了Gemini 2.5 Pro和GPT-5等闭源模型,同时性能接近前代超大规模模型Qwen2.5-VL-72B [3] ,标志着多模态AI从”参数竞赛”向”效率优先
坐吃山猪10 小时前
llm·glm·phone
AutoGLMPhone06-源码-模型替换针对智谱AI-AutoGLM-开源的手机智能体,整理代码拆解步骤,当前针对模型进行替换测试当时在使用GLM的【autoglm-phone】模型,当前模型是专门为手机自动化操作定制的大圆模型,LLM模型返回指定的标签,而不是传统的JSON格式。
Mr.朱鹏11 小时前
java·python·学习·微服务·langchain·大模型·llm
大模型入门学习路径(Java开发者版)下《动手学深度学习》(李沐)吴恩达《ChatGPT Prompt Engineering for Developers》
simplify2011 小时前
开源·llm
SWEDeepDiver:从哪里来,去往何处大学时代,主修专业是测控技术与仪器,和硬件打交道比较多,主要编程语言是汇编和C。后来学习Java时,Get到一个新技能:Java Swing(Java GUI框架),这之后,仿佛打开了新世界的大门,兴奋地动手做了一系列GUI程序:例如某音乐网站音乐下载器程序、物理实验报告程序等。
想用offer打牌13 小时前
人工智能·python·llm
LLM参数: Temperature 与 Top-p解析大家好!平常在大模型的使用中,同一句话的输入,同一的大模型的输出都会不同。那么为什么会这样呢?是什么导致了这样的随机性呢?今天我们来讲讲LLM的参数:Temperature 与 Top-p
Mr.朱鹏14 小时前
java·开发语言·spring boot·spring·大模型·llm·transformer
大模型入门学习路径(Java开发者版)上学习资源:1. Zero-Shot提示2. Few-Shot提示3. Chain-of-Thought(思维链)
snoopy_2117 小时前
llm
在LLM中为什么用RMSNorm,可不可以分母为L2 Norm在现代大语言模型(LLM)如 LLaMA、Gopher、Chinchilla 中,RMSNorm (Root Mean Square Layer Normalization) 确实已经取代了传统的 LayerNorm 成为主流选择。
CoderJia程序员甲21 小时前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2025-12-20)生成于:2025-12-20共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜凸显AI工程化与平民化两大趋势,技术热点集中在智能体应用与效率工具开发。NVIDIA的Gym项目助力量化交易策略优化,Letta和droidrun推动具备记忆能力的智能体落地,而exo项目则致力于利用日常设备构建低成本AI集群。同时,PentestGPT将AI赋能安全攻防,Astral推出的Ty类型检查器显著提升Python代码质量。这些项目共同展示了AI技术正从研究走向实践,聚焦解决实际业务场景中的自动化与效率难题,
智泊AI1 天前
llm
AI概念扫盲:LoRA微调原理是什么?LoRA(Low-Rank Adaptation)是一种用于微调大型语言模型(LLM)的高效方法,能够在不大幅增加计算资源的情况下,让模型快速适应新任务或新领域。
阿湯哥1 天前
llm·框架·agent·mcp·分工
基于MCP协议的LLM-Agent数据流转与业务实现详解MCP (Model Context Protocol) 不仅仅是一个简单的工具调用协议,更是连接大语言模型(LLM)与外部世界的重要桥梁。本文将深入分析在基于MCP协议的AI Agent系统中,数据如何在用户、LLM、MCP Client、MCP Server之间流转,并详细说明哪些功能可以通过框架实现,哪些需要根据具体业务进行定制开发。
CoderJia程序员甲1 天前
ai·开源·llm·github
GitHub 热榜项目 - 日榜(2025-12-19)生成于:2025-12-19共发现热门项目: 12 个榜单类型:日榜本期GitHub热点显示AI应用全面开花,尤其聚焦于金融量化、智能体和语音合成领域。AI对冲基金和OpenBB平台展现了Python在量化金融与AI融合的强劲势头,为开发者提供了可落地的实战工具。同时,具备记忆与自学习能力的状态化智能体Letta和语音项目ChatterBox、CosyVoice突显了多模态与长上下文处理的技术前沿,而Astral出品的极速Rust类型检查器Ty则彰显了底层工具链的性能优化趋势。整体来看,开源项目正从模型研
骚戴2 天前
人工智能·python·大模型·llm·gateway·api
n1n:从替代LiteLLM Proxy自建网关到企业级统一架构的进阶之路摘要:在 2025 年的大模型应用开发中,如何统一管理 GPT-4、Claude 3.5、Gemini 1.5 等异构 API 成为企业的核心痛点。本文将深度解析开源网关 LiteLLM 的技术原理与实施路径,剖析自建网关在生产环境中的“隐形深坑”,并探讨如何通过 n1n.ai 等企业级聚合架构实现从“可用”到“高可用”的跨越。
沛沛老爹2 天前
人工智能·ai·langchain·llm·agent·提示词·web转型
Web开发者进阶AI Agent:LangChain提示词模板与输出解析器实战图片来源网络,侵权联系删。在Web开发中,我们习惯通过模板引擎(如EJS、Handlebars)动态生成HTML,也依赖JSON Schema校验或Zod/Yup对API响应做结构化解析。这种“输入模板化 + 输出结构化”的工程思维,恰恰是构建可靠AI Agent应用的核心。
骚戴2 天前
人工智能·python·大模型·llm·gateway·api
LLM API Gateway:LLM API 架构、AI 聚合与成本优化全解(2025深度指南)摘要:从 OpenAI 引发的 AI API Gateway 经济变革,到企业级多模型聚合架构 n1n.ai 的最佳实践。本文将深入剖析 LLM API 的技术细节(协议、鉴权、参数调优),探讨“自建网关”与“聚合服务”的优劣权衡,并提供 Python 实战代码演示如何构建高可用的多模型 Agent。
snoopy_212 天前
llm
LLM中位置编码太棒了!你问到了 Transformer 的“灵魂”之一。如果没有位置编码(Positional Encoding),Transformer 模型就像一个把所有词扔进搅拌机里的人,它知道有哪些词,但完全不知道它们的顺序。
Robot侠2 天前
大数据·python·llm·prompt·提示工程
极简LLM入门指南4构建LLM应用的核心不只是调用API,更关键的是如何给模型写出有效的指令。同样的问题,用不同的方式提问,结果质量可能相差很大。这就是Prompt工程的核心价值。
智泊AI3 天前
llm
为什么通用Agent很难实现企业化落地?为什么很多项目在Demo演示的时候堪称惊艳,但到真正的企业化落地时却总是翻车?背后的问题究竟是什么?我们今天一起来看看!
大模型教程3 天前
程序员·llm·agent
14天速成LLM高手!大佬开源学习笔记,GitHub狂揽700星本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。无论是面试找工作、还是自学创业,甚至想要在圈子内讨论一下AGI的潜力,但凡想要深度参与到AI浪潮中,不可避免的就是学习大型语言模型(LLM)的底层原理。
AI大模型3 天前
程序员·llm·agent
大模型相关术语和框架总结|LLM、MCP、Prompt、RAG、vLLM、Token、数据蒸馏本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。大模型在今年的热度可以说是现象级的。从年初Deepseek ,Manus的爆火出圈到日常app中都能看到大模型的身影。