技术栈
掘金·日新计划
聚客AI
3 天前
人工智能
·
llm
·
掘金·日新计划
🚀碾压传统方案!vLLM与TGI/TensorRT-LLM性能实测对比
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。随着大语言模型(LLM)在生成式AI产业中广泛应用,如何高效、经济地部署和推理这些庞大的模型,成为每一位开发者和企业面临的核心挑战。尤其是在构建真实的在线AI应用时,性能瓶颈、资源浪费、高昂费用等问题层出不穷。
聚客AI
7 天前
人工智能
·
llm
·
掘金·日新计划
🔥MoE技术大揭秘:混合专家模型如何重塑AI大模型?
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。近年来,混合专家模型(Mixture of Experts, MoE)技术在大模型领域迅速崛起,成为解决计算效率和扩展性问题的关键创新。我将从核心原理、显著优势、落地应用以及当前挑战四个方面,全面解析MoE技术。内容力求深入浅出,并结合图文增强理解。现在,让我们一起揭开MoE的神秘面纱。
聚客AI
10 天前
人工智能
·
llm
·
掘金·日新计划
💡小白都能看懂的RAG分块实战:从递归分割到LLM智能拆解的全解析
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。在构建RAG(检索增强生成)系统时,文本分块质量直接影响知识检索精度与LLM输出效果。本文将深入解析五种分块策略的工程实现与优化方案。文中还会放一些技术文档,方便大家更好的理解RAG中常见的技术点。
聚客AI
11 天前
人工智能
·
llm
·
掘金·日新计划
✅掌握ReAct=掌控AI代理灵魂:从工具调用、循环架构到生产级优化
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。ReAct(Reasoning + Action)是一种让大语言模型(LLM)自主完成任务的核心架构。与传统直接生成答案的模式不同,ReAct 要求代理交替执行以下两步:
聚客AI
14 天前
人工智能
·
llm
·
掘金·日新计划
✨17种RAG实现方法:全面提升生成质量
本文较长,建议点赞收藏,以免遗失。由于文章篇幅有限,文末还额外给大家整理了一些技术文档,相信对你会有不少的帮助。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。
聚客AI
20 天前
人工智能
·
llm
·
掘金·日新计划
🔥开源碾压闭源!Qwen3-Coder终端接入指南,小白也能玩转
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院通义千问最新开源的Qwen3-Coder已成为编程大模型的标杆。其核心技术亮点包括:
yeshan
21 天前
ai编程
·
claude
·
掘金·日新计划
使用 Claude Code 的自定义 Sub Agent 完善博文写作体验
#金石焕新程#Claude Code ! Claude Code ! 停不下来了~ 两天前, Claude Code 可以自定义自己的 AI Agent 了 -> docs.anthropic.com/en/docs/cla….
聚客AI
21 天前
人工智能
·
llm
·
掘金·日新计划
🚀深度解析Agentic RAG:如何突破模型的知识边界
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院在AI大模型应用开发中,大型语言模型(LLMs)的内在知识局限性始终是核心挑战。模型训练数据的有限性(如时效性问题和私域数据缺失)导致其无法独立处理动态或垂直领域的任务。为此,检索增强生成(RAG) 技术应运而生,并经历了从简单流水线到高度自主智能体的重大演化。本文将深入探讨RAG的技术演进、关键突破(如Agentic RAG和DeepSearch),以及未来向通用型智能体的发展趋势,为开发者提供实用洞见。
聚客AI
1 个月前
人工智能
·
llm
·
掘金·日新计划
👉LLM的进化路线、领域微调及NLP的应用落地方式
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院技术突破:现存挑战:
聚客AI
1 个月前
人工智能
·
llm
·
掘金·日新计划
🚀解密向量空间:AI开发者必学的RAG架构与代码全解
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。核心组件作用:
AI大模型技术社
1 个月前
人工智能
·
llm
·
掘金·日新计划
✅2025全网最具权威深度解析并手写RAG Pipeline
本文较长,建议点赞收藏,以免遗失。文末还有粉丝福利,实力宠粉。为了帮助大家从底层更好地理解 RAG 的工作原理,带你撕开技术黑箱,仅用numpy等Python基础库构建RAG系统,从零手撕RAG内核!从文本划分、向量化、相似度检索到生成优化,逐行代码解剖检索增强生成的核心逻辑,更深度解析9大实战技巧:从智能分块策略到动态上下文压缩,助你突破回答质量瓶颈。拒绝做调参工具人,这次彻底掌握RAG的底层基因!
聚客AI
1 个月前
人工智能
·
llm
·
掘金·日新计划
大模型学习进阶路线图:从Prompt到预训练的四阶段全景解析
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。在探讨大模型(LLM)的四阶段技术时,我们可以从Prompt Engineering(提示工程)、AI Agent(人工智能代理)、Fine-tuning(微调)以及Pre-training(预训练)这四个关键阶段来详细 阐述,这四个阶段技术层层递进。
聚客AI
1 个月前
人工智能
·
llm
·
掘金·日新计划
Embedding进化论:从Word2Vec到OpenAI三代模型技术跃迁
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。嵌入(Embedding)是将离散对象(单词、句子等)映射到连续向量空间的数学过程。给定文本对象 xx,嵌入函数 ff 满足:
聚客AI
1 个月前
人工智能
·
llm
·
掘金·日新计划
解构高效提示工程:分层模型、文本扩展引擎与可视化调试全链路指南
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。结语:通过本方案,企业级AI系统提示工程迭代效率可提升300%,输出质量平均提高45%。更多AI大模型应用开发学习视频内容和资料,尽在聚客AI学院。
聚客AI
1 个月前
人工智能
·
掘金·日新计划
·
mcp
🚀拒绝试错成本!企业接入MCP协议的避坑清单
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。核心作用:解决传统情感分析中“上下文缺失”和“动态场景适应”难题
聚客AI
2 个月前
人工智能
·
llm
·
掘金·日新计划
工业级Prompt设计手册:构建高准确率AI应用的10个黄金法则
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。从理论到实践,掌握Zero-shot/Few-shot Prompt设计精髓。
聚客AI
2 个月前
人工智能
·
llm
·
掘金·日新计划
「实战指南」90%+准确率的BERT微调:情感分析模型落地指南
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。从零掌握BERT微调核心技术,一小时构建工业级文本分类模型。
聚客AI
2 个月前
人工智能
·
llm
·
掘金·日新计划
🧠 预训练核心解密:Masked Language Model运作原理解析
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。本文深入剖析大模型迁移学习核心机制,结合Hugging Face实战代码,掌握预训练模型高效应用之道。
聚客AI
2 个月前
人工智能
·
llm
·
掘金·日新计划
🔥 Transformers实战:Text分类×SQuAD问答×CoNLL实体识别(含超参调优方案)
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。本文将通过代码实战带你快速掌握NLP三大核心任务,使用Hugging Face Transformers库实现工业级AI应用开发。
聚客AI
2 个月前
人工智能
·
llm
·
掘金·日新计划
🛫AI大模型训练到发布一条龙:Hugging Face终极工作流
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。本文全面解析Hugging Face Transformers库的核心功能,通过丰富示例和最佳实践,带你快速掌握预训练模型的加载、使用和微调技术。