技术栈
llm
水煮蛋不加蛋
2 天前
人工智能
·
ai
·
机器人
·
大模型
·
llm
·
rag
RAG 赋能客服机器人:多轮对话与精准回复
在人工智能技术飞速发展的今天,客服机器人已成为企业提升服务效率的重要工具。然而,传统客服系统在多轮对话连贯性和精准回复能力上存在明显短板。检索增强生成(Retrieval-Augmented Generation, RAG)技术通过结合大语言模型(LLM)与外部知识库,为解决这一问题提供了创新路径。本文将深入探讨 RAG 在客服机器人中的应用,重点分析其如何实现多轮对话与精准回复,并结合实际案例与技术框架展开讨论。
zstar-_
2 天前
人工智能
·
python
·
macos
·
llm
FreeTex v0.2.0:功能升级/支持Mac
FreeTex在发布之后,迎来很多反馈,本次根据主流的反馈建议,又进行一轮小升级,正式发布v0.2.0版本,主要升级点如下:
江小皮不皮
3 天前
人工智能
·
llm
·
nlp
·
aigc
·
sse
·
mcp
·
fastmcp
为何选择MCP?自建流程与Anthropic MCP的对比分析
在当前的AI技术浪潮中,如何高效、可靠地让大型语言模型(LLM)与外部工具和服务进行交互,是一个核心议题。Anthropic提出的模型组件协议(Model Component Protocol, MCP)旨在为此提供一个标准化的解决方案。然而,一个关键问题随之而来:采用MCP与我们自行构建一套类似的工具调用流程,究竟有何本质区别?我们选择MCP的驱动力是什么? 本文将深入剖析这两者之间的异同,并探讨MCP背后的潜在意义。
q_q王
3 天前
python
·
大模型
·
llm
·
语音识别
FunASR阿里开源的语音识别工具
FunASR是一个由阿里云智能团队开源的语音识别工具。它旨在通过发布工业级语音识别模型的训练和微调,促进学术研究和工业应用之间的交流,推动语音识别生态的发展。
pedestrian_h
3 天前
java
·
spring boot
·
笔记
·
llm
·
ollama
·
deepseek
Spring AI 开发本地deepseek对话快速上手笔记
Spring AI是一个旨在推进生成式人工智能应用程序发展的项目,Spring AI的核心目标是提供高度抽象化的组件,作为开发AI应用程序的基础,使得开发者能够以最少的代码改动便捷地交换和优化功能模块
浪淘沙jkp
3 天前
人工智能
·
llm
·
embedding
·
agent
·
知识库
·
dify
·
deepseek
AI大模型学习二十、利用Dify+deepseekR1 使用知识库搭建初中英语学习智能客服机器人
很多情况下 LLM 知识库可以让 Agent 从中定位到准确的信息,从而准确地回答问题。在一些特定领域,比如客服、检索工具等有应用。
HuggingFace
4 天前
大模型
·
llm
大模型评估排障指南 | 关于可复现性
这是 大模型评估排障指南 系列文章的第三篇,敬请关注系列文章:假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么? 让我们来探讨一下原因。
AI大模型顾潇
4 天前
数据库
·
人工智能
·
安全
·
大模型
·
llm
·
微调
·
llama
[特殊字符] 本地部署DeepSeek大模型:安全加固与企业级集成方案
零信任架构设计:实施要点:建立VPN隧道:wg genkey | tee privatekey | wg pubkey > publickey
十里清风
5 天前
llm
LLM量化方法:ZeroQuant、LLM.int8()、SmoothQuant、GPTQ、AWQ
参考论文参考文章ZeroQuant 对权重使用group-wise量化,对激活采用dynamic per-token量化,并实现fusion kernel,加速量化。同时,设计了逐层知识蒸馏LKD,进一步提高量化精度。
知来者逆
5 天前
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
llm
在与大语言模型交互中的礼貌现象:技术影响、社会行为与文化意义的多维度探讨
关于是否值得对 AI 保持礼貌的公众意见,几乎和咖啡或红酒的最新研究结果一样频繁变化——这个月被推崇备至,下个月又受到质疑。即便如此,越来越多的用户现在在提示语中加入“请”或“谢谢”,这不仅仅是因为习惯,或者担心粗鲁的交流会延续到现实生活中,而是因为他们相信礼貌能够带来更好、更高效的结果。
SHIPKING393
5 天前
llm
·
prompt
·
文生图
【Prompt工程—文生图】案例大全
目录一、人物绘图二、卡通头像三、风景图四、logo设计图五、动物形象图六、室内设计图七、动漫风格八、二次元图
水煮蛋不加蛋
6 天前
人工智能
·
microsoft
·
ai
·
开源
·
大模型
·
llm
·
agent
AutoGen 框架解析:微软开源的多人 Agent 协作新范式
在大语言模型(LLM)快速发展的今天,复杂任务的自动化协作需求日益增长。微软开源的AutoGen 框架(GitHub Star 超 10 万)提供了一种基于多智能体对话的协作范式,通过自然语言交互实现多角色 Agent 的灵活编排,支持人机协同、代码执行、分布式扩展等能力,为构建智能应用提供了全新思路。
Two summers ago
6 天前
论文阅读
·
人工智能
·
机器学习
·
llm
·
强化学习
arXiv2025 | TTRL: Test-Time Reinforcement Learning
https://github.com/PRIME-RL/TTRL📖导读:本篇博客有🦥精读版、🐇速读版及🤔思考三部分;精读版是全文的翻译,篇幅较长;如果你想快速了解论文方法,可以直接阅读速读版部分,它是对文章的通俗解读;思考部分是个人关于论文的一些拙见,欢迎留言指正、探讨。最佳排版建议使用电脑端阅读。
AI大模型顾潇
7 天前
数据库
·
人工智能
·
机器学习
·
大模型
·
llm
·
llama
·
milvus
[特殊字符] Milvus + LLM大模型:打造智能电影知识库系统
这个项目基于Milvus官方案例改造,实现了:电影数据向量化存储语义搜索功能大模型智能总结中英文自动翻译
Alfred king
8 天前
llm
·
nlp
·
vllm部署
华为昇腾910B通过vllm部署InternVL3-8B教程
本文主要借鉴:VLLM部署deepseek,结合自身进行整理auto-dl上选择单卡910B即可,Pytorch框架只有一个CANN版本选择,选这个即可。
CoderJia程序员甲
9 天前
运维
·
人工智能
·
云原生
·
kubernetes
·
llm
AI驱动的Kubernetes管理:kubectl-ai 如何简化你的云原生运维
kubectl-ai 是一个由 Google云孵化的开源项目(需要注意,根据项目说明,这并非 Google 官方支持的产品),它巧妙地将大型语言模型 (LLM) 的能力引入到 Kubernetes 的日常操作中。想象一下,你不再需要精确回忆 kubectl 的每一个子命令和参数组合,只需用日常语言向 kubectl-ai 描述你的意图,它就能为你分析、转换并执行相应的 Kubernetes 操作。
董厂长
9 天前
网络
·
人工智能
·
深度学习
·
llm
LLM :Function Call、MCP协议与A2A协议
大型语言模型 (LLM) 的日益精进,使其能力已超越简单的文本生成,迈向与现实世界进行复杂交互的新阶段。为了真正发挥其潜力,LLM 需要能够访问外部信息并执行操作的机制,这催生了函数调用等技术的发展。此外,人工智能代理的兴起需要标准化的通信和协作方式,从而出现了 MCP 和 A2A 等协议。本文旨在解读这三个关键概念:LLM 的函数调用、模型上下文协议 (MCP) 和 Agent to Agent (A2A) 协议,通过清晰的定义、实例以及对比分析,帮助读者全面理解这些技术及其各自的角色。
tangjunjun-owen
9 天前
langchain
·
llm
·
word
·
faiss
·
rag
第三章:langchain加载word文档构建RAG检索教程(基于FAISS库为例)
如果你已有了向量embed模型,该如何构建一个检索方法呢?本节就是一个完整的构建教程,使用word文档载入到分块再到向量化,并利用数据库进行检索。我们使用FAISS库来实现这个功能,依然使用langchain款就爱来完成。该代码实现是比较简单的,但这仅仅是给初学者学习的。我们会进一步从底层源码进行解读,给出更深入讲解。
yutianzuijin
10 天前
服务器
·
ubuntu
·
llm
·
大模型推理
大模型推理--从零搭建大模型推理服务器:硬件选购、Ubuntu双系统安装与环境配置
自从大模型火了之后就一直想自己组装一台机器去深入研究一下大模型,奈何囊中羞涩,迟迟也没有行动。在下了很大的勇气之后,终于花了接近4万块钱组装了一台台式机,下面给大家详细介绍一下我的装机过程。
CoderJia程序员甲
10 天前
ai
·
llm
·
github
·
ai教程
·
rag技术
RAG_Techniques:探索GitHub热门RAG技术开源项目
在当今AI领域,检索增强生成(Retrieval-Augmented Generation,简称RAG)技术正以惊人的速度发展,成为将传统信息检索与生成式AI相结合的革命性方法。本文将带您深入探索GitHub上备受瞩目的RAG_Techniques项目,这是目前最全面的RAG技术集锦之一,为研究人员和实践者提供了丰富的高级技术实现和示例。