llm

TGITCIC9 小时前
llm·rag·ai agent·ai智能体·ai产品·大模型ai·rag增强检索
RAG中的语义理解与语义检索:别再混为一谈近年来,RAG(Retrieval-Augmented Generation)架构已成为大模型落地应用的主流范式之一。它通过将外部知识库引入生成过程,有效缓解了模型幻觉、知识滞后等问题。然而,在实际构建和优化RAG系统时,许多开发者对其中两个核心概念——“语义理解”与“语义检索”——的理解仍显模糊。有人将二者等同,认为只要用了向量数据库就等于实现了语义能力;也有人误以为语义检索的结果质量完全取决于嵌入模型,而忽视了前端理解环节的关键作用。这种混淆直接导致系统设计偏差:要么过度依赖检索而忽略提示工程,要么在
坐吃山猪13 小时前
python·llm·playwright·browser-use
BrowserUse11-源码-LLM模块LLM 模块的核心设计理念是通过抽象接口统一不同厂商的大语言模型调用方式。这种设计使得上层应用可以无缝切换不同的模型提供商,而无需修改业务逻辑。
AI大模型14 小时前
程序员·llm·agent
一篇图文彻底搞懂什么是AI Agent本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。AI Agent也叫Agent,是开发复杂大模型应用场景中非常重要的概念,但是很多人并不清楚Agent是什么?它是如何运作的?本文用图文的形式彻底搞懂这两个问题。
云雾J视界18 小时前
llm·aiops·工具链·cld·心智模式·边界重构
AIOps失效?用“思考的魔方®“破解运维复杂性的三重维度在微服务、云原生、AI大模型叠加的当代技术栈中,系统的动态性、关联性和涌现性已远超人类直觉的边界。告警不再是孤立的信号,而是系统结构发出的"人声";故障不再是偶发的事件,而是因果回路累积的"显影"。本文将揭示:AIOps的失效,本质是思维框架的失效。通过一套三维思考支架,我们将系统思考的底层逻辑注入智能运维实践,让工具回归工具,让思维驾驭复杂。
AI大模型学徒18 小时前
人工智能·chatgpt·大模型·llm·知识库·deepseek
大模型应用开发(十五)_知识库1总结:大模型强在生成和语言理解,但弱在真实感知、因果推理、知识准确性和资源效率。“如何给大模型喂知识”,通常涉及 知识增强(Knowledge Injection/Integration) 的方法。不同场景下有不同手段,可以大致分为 训练时注入 和 推理时补充 两类:
flying_131419 小时前
llm·对比学习·多模态大模型·icl·notellm·micl·late fusion
推荐大模型系列-NoteLLM-2: Multimodal Large Representation Models for Recommendation(二)目录一、方法论模板说明视觉笔记表示多模态笔记表示后期融合关键点编辑二、实验2.1 性能评估2.2 增强型MLRM的显著性分数分析
flying_131420 小时前
llm·推荐系统·多模态大模型·mllms·mlrms·端到端训练·生成式大模型
推荐大模型系列-NoteLLM-2: Multimodal Large Representation Models for Recommendation(三)目录一、训练细节二、端到端MLRM细节三、Qwen-VL-Chat的显著性分数分析传统MLLMs与MLRMs的适配问题
302AI20 小时前
llm·chatglm (智谱)
GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?智谱 AI 于 12 月 8 日正式开源了其新一代多模态模型 GLM-4.6V 系列,包含面向高性能场景的 106B 版本与轻量本地部署的 9B Flash 版。此次升级不仅将训练上下文窗口一举推至 128K tokens,更在模型架构中做了一个关键变革:让工具调用(Function Call)成为视觉模型的原生能力。这意味着,模型不再止步于识别图像,而是能自主调用工具、处理结果并持续执行——从看清世界到动手完成的路径被首次彻底打通。
小鱼小鱼.oO21 小时前
llm·框架
4 大主流思考框架:CoT、ReAct 、Plan-Act 与 Plan-and-Execute思维链(Chain of Thought,CoT)是提升大语言模型(LLM)处理复杂推理任务的核心技术。
海边夕阳20062 天前
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·llm
【每天一个AI小知识】:什么是大语言模型(LLM)?目录一、小明的论文摘要风波:从故事说起二、大语言模型的基本概念2.1 什么是大语言模型?2.2 大语言模型的特点
bj_zhb2 天前
python·llm
图片的base64表示以 data:image/ 开头的字符串是一种名为 Data URI(或称 Data URL)的方案。
CoderJia程序员甲2 天前
git·ai·开源·llm·github
GitHub 热榜项目 - 日榜(2025-12-11)生成于:2025-12-11共发现热门项目: 14 个榜单类型:日榜本期GitHub热榜显示AI编程助手与智能体开发已成绝对主流,多款高星项目聚焦于此。技术热点集中在能自主执行复杂任务的高级AI智能体,例如能自动记录并压缩编程上下文的claude-mem、可执行安装测试的goose,以及开源的Agent开发规范agents.md。同时,面向实践的教育项目如《从零开始构建智能体》和微软的入门教程也异常火爆。这反映出行业正从单纯使用大模型转向构建具备记忆、执行和持续学习能力的可靠AI助手,开发者积极拥抱能解决
AI大模型2 天前
程序员·llm·agent
【连载】零基础跟我学做AI Agent(第4课:用Autogen开发一个学霸Agent)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。今天讲第4课,用Microsoft Autogen做一个多角色Agent应用。
AI大模型2 天前
langchain·llm·agent
【连载】零基础跟我学做AI Agent(第3课:用LangChain开发一个做题Agent)本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。今天讲第3课,用一个做Agent的经典框架——LangChain,开发一个做数学题的Agent。
恋上钢琴的虫2 天前
llm
【大模型实战篇】利用TensorRT LLM部署及推理大模型实战(bloom560m、chatglm-6b等大模型)摘自:https://blog.csdn.net/weixin_65514978/article/details/143815654
沛沛老爹2 天前
大模型·llm·安装·helloworld·rag·lightrag·ai入门
LightRAG系列3:LightRAG 环境准备与快速启动图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
亚里随笔2 天前
人工智能·语言模型·自然语言处理·llm·rl·agentic
推理语言模型训练策略的协同作用:预训练、中间训练与强化学习的交互机制近年来,强化学习技术在语言模型推理能力提升方面取得了显著进展,但后训练是否真正扩展了模型在预训练期间获得的推理能力仍存在争议。这项研究通过完全可控的实验框架,揭示了预训练、中间训练和强化学习后训练之间的因果贡献关系,为理解推理语言模型训练策略提供了重要基础。
Mintopia2 天前
人工智能·llm·aigc
🚀 技术并购视角:AIGC领域的 Web 生态整合与资源重组在过去的十年,AIGC (AI Generated Content) 从学术论文里的冷僻缩写,华丽转身为市场的宠儿。 如今,AI 不仅能写(比如我👋),还能画、能唱、能推理、能陪你聊人生。
Baihai_IDP2 天前
人工智能·面试·llm
压缩而不失智:LLM 量化技术深度解析编者按: 如何在资源受限的设备上高效部署大语言模型,同时还尽可能保持其性能表现?我们今天为大家带来的这篇文章,作者的核心观点是:量化技术通过在模型精度与效率之间寻找最优平衡点,使得大语言模型能够在资源受限的设备上高效部署,而几乎不降低其“智能水平”。