llm

ApiHug18 小时前
java·人工智能·ai·llm·apihug·apismart·mcp
Spring boot 3.4 后 SDK 升级,暨 UI & API/MCP 计划PS 写这篇文章后看到A Deep Dive Into MCP and the Future of AI Tooling | Andreessen HorowitzWe explore what MCP is, how it changes the way AI interacts with tools, what developers are already building, and the challenges that still need solving. https://a16z.com/a-
致Great1 天前
人工智能·llm
玩转RAG应用:如何选对Embedding模型?在打造检索增强生成(RAG)应用时,选择合适的Embedding模型就像挑选合适的工具,直接影响到应用的表现和效果。那么,面对众多的模型,我们该如何轻松找到最适合的那一款呢?
yugasun1 天前
llm·aigc·mcp
🌟 初探 MCP:给大模型插上 USB-C 接口?🌟最近发现身边的 AI 开发者们都在聊一个叫 MCP 的新协议,有人说它是「AI 时代的 USB-C」,有人甚至用它做出了能自动写代码的 IDE!作为技术圈的吃瓜群众,我决定扒一扒这个神奇的 MCP,看看它到底是如何让 AI 模型和各种数据源、工具无缝联动的。
nt11071 天前
前端·langchain·llm
大模型实现sql生成 --- 能力不足时的retry最近做了一个大模型demo,自动生成sql,获取数据然后在前端页面画图。这个demo的核心就是大模型生成sql的准确性,后面的都是常规前后端。
小生凡一1 天前
llm·mcp
什么是MCP|工作原理是什么|怎么使用MCP|图解MCPManus的爆火似乎推动了MCP的出圈,虽然Manus没有用MCP。这篇文章我们就讲讲MCP,当然我也是最近才学习到MCP的,如果理解有误的地方,欢迎评论区指出!
大模型铲屎官2 天前
开发语言·人工智能·深度学习·算法·机器学习·llm·支持向量机(svm)
支持向量机(SVM):从入门到精通的机器学习利器01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChain:从文档加载到高效问答系统构建的全程实战 05-玩转 LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与LLM辅助评估) 06-从 0 到 1 掌握 LangChain Agents:自定义工具 + LLM 打造智能
鲁子狄2 天前
llm
[笔记] 探索DeepSeek+现代知识库搭建:Ollama及主流开源工具在现代知识库搭建中的应用与实践——一站式详尽指南随着大语言模型(LLM)的浪潮席卷而来,许多开源工具与平台纷纷涌现,帮助开发者快速搭建自己的 AI 助手或应用。对于想要在本地或自托管环境中运行 LLM 的用户而言,Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化“本地推理”方案。
阿正的梦工坊2 天前
llm
温度(Temperature)在大模型输出中的作用与底层原理在深度学习领域,尤其是自然语言处理(NLP)中,大型语言模型(LLM)的输出生成通常依赖于概率分布的采样。温度(temperature)作为一个超参数,在控制输出分布的“平滑性”或“尖锐性”方面起着关键作用。本文将深入探讨温度的作用、底层原理,以及它在softmax函数中的具体实现,并提供代码示例,帮助研究者更好地理解和应用这一概念。
鲁子狄2 天前
人工智能·llm
[笔记] 深入指南:使用 OpenManus 本地部署使用指南在这个快速变化的技术时代,找到一个能够有效支持项目管理与团队协作的工具变得尤为重要。今天,我们将一起探索一款名为OpenManus的新兴开源解决方案。无论你是开发新手还是经验丰富的技术专家,OpenManus都提供了一套全面的功能来满足你的需求,从而让项目管理变得更加简单而高效。
致Great2 天前
人工智能·llm
为什么 RAG 会失败以及如何解决?揭秘背后三大致命缺陷!检索增强生成 (RAG) 能让 大型语言模型 (LLM) 借助外部知识,提高回答的准确性和上下文理解能力。不过,RAG 并不总是那么可靠,在很多情况下会“翻车”,导致输出的内容不够准确或相关。这种问题影响了从客服到研究、内容创作等多个领域。要想打造更稳定、实用的 AI 检索系统,我们得先搞清楚 RAG 哪里容易出错。本文会聊聊 RAG 失败的常见原因,并探讨如何优化它,让 AI 生成的内容更高效、更稳定。
致Great2 天前
人工智能·llm
AI老板心中的迈巴赫:DeepSeek+Ollama+Xinference+RAGFlow+Dify部署教程,RAG产品化体验5件套DeepSeek-R1火了之后,Ai老板部署需求大大提升,抛开效果不谈,五件套易用性和灵活性相比VLLM大大提升,门槛较低,但是效果不言而喻。 以下部署全部以docker方式进行,因为太方便了,但同时坑很多,请做好心理准备
致Great2 天前
人工智能·llm
推理大模型的后训练增强技术-Reasoning模型也进化到2.0了,这次居然学会用工具了论文题目:START: Self-taught Reasoner with Tools论文链接:arxiv.org/pdf/2503.04…
致Great2 天前
人工智能·llm
推理大模型的后训练增强技术-从系统1到系统2:大语言模型推理能力的综述35/100发布文章加粗斜体标题删除线无序有序待办引用代码块运行代码资源绑定图片视频表格超链接投票导入
kcarly3 天前
开源·llm·开发平台·dif
Dify 项目开源大模型应用开发平台Dify 是一款开源的大语言模型(LLM)应用开发平台,旨在简化生成式 AI 应用的创建、部署和持续优化流程。以下从多个维度对该项目进行详细介绍:
阿里云大数据AI技术3 天前
机器学习·llm·api
如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介随着大模型(LLM)技术的爆发式应用,如何快速、客观评估模型回复质量成为行业痛点。对于回答客观问题的LLM,目前业内已经有比较成熟的数据集进行效果评测与模型打榜。但是如何对一个开放式生成LLM进行效果评估,尤其在知识问答、客服对话、内容合规、RAG(检索增强生成)等场景中,目前主流的评测方式仍存在一定的局限性:
Baihai_IDP3 天前
llm·aigc·deepseek
DeepSeek-V3 技术解析:DeepSeek 如何优化 MoE?编者按: 为什么说 DeepSeekMoE 的“共享专家隔离”设计,既能保留通用知识又能减少冗余?传统 MoE 的专家真的“专精”吗?传统 MoE 专家易“崩溃”,DeepSeekMoE 如何通过“更细粒度的专家分割”让每个专家专注更小领域,解决负载不均衡问题?
UniqueUnit4 天前
vscode·大模型·llm·智能体·mcp·模型上下文协议·copilot mcp
VSCode扩展工具Copilot MCP使用教程【MCP】MCP(Model Context Protocol,模型上下文协议) ,2024年11月底,由 Anthropic 推出的一种开放标准,旨在统一大型语言模型(LLM)与外部数据源和工具之间的通信协议。本文章教你使用VSCode扩展工具Copilot MCP快速上手MCP应用!
量子位4 天前
人工智能·机器人·llm
宇树机器人侧空翻惊呆网友:“我 ** 想要一个!”这下特效视频和机器人实拍真的傻傻分不清楚了…前几天机器人卷的还是前后空翻呢,宇树现在连侧空翻都曝出来了。
百度Geek说4 天前
百度·llm
两连发!文心大模型4.5及X1,上线千帆!3月16日,文心大模型4.5和文心大模型X1正式发布!目前,两款模型已在文心一言官网上线,免费向用户开放。_(yiyan.baidu.com/)_同时,文心大模型4…
leo03085 天前
人工智能·大模型·llm·huggingface
修改HuggingFace模型默认缓存路径huggingface模型的默认缓存路径是~/.cache/huggingface/hub/通常修改为自己的路径会更为方便。