技术栈
llm
藏锋入鞘
14 小时前
llm
现代 AI 知识库基石:文本嵌入、向量数据库与 RAG 原理全解析
文本嵌入模型是大语言模型的基石和早期雏形,大语言模型则是文本嵌入模型结合“动态上下文理解”产生的巨大飞跃,这篇博客会从文本嵌入出发,由浅入深去探索文本嵌入、向量数据库、RAG 的本质。
一 铭
15 小时前
人工智能
·
语言模型
·
大模型
·
llm
数据库询问RAG框架Vanna的总体架构
Vanna是一个数据库询问的RAG框架,可以通过自然语言来和数据库对话。本质上来说Vanna是以RAG框架的模式来设计的。其中有一个训练的过程,而所谓训练的过程其实就是把相关知识,包括:DDL,table信息,相关文档等信息,添加到向量数据库中。
楽码
17 小时前
后端
·
llm
·
openai
MIT有研究表示使用人工智能导致智力下降
我们认为我们研究中一些最引人注目的观察结果源自第4节,在该节中,脑-大型语言模型(Brain-to-LLM)参与者显示出比大型语言模型(LLM)组的第1、2、3节更高的神经连接性(网络范围内的α、β、θ和δ波段定向连接的峰值)。
智泊AI
17 小时前
llm
SFT-指令微调是什么?SFT的流程是怎样的?
1、什么是SFT?SFT,全称是 Supervised Fine-tuning(有监督微调),在大语言模型中通常指“指令微调”。
dundunmm
17 小时前
论文阅读
·
大模型
·
llm
·
rag
·
检索增强生成
·
评估标准
【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)
代码地址:GitHub - USTCAGI/CRAG-in-KDD-Cup2024【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(1)-CSDN博客
聚客AI
18 小时前
人工智能
·
llm
·
agent
📈 15分钟构建AI工作流:LangGraph+Dagre自动排版全解
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院核心特性:实现技术:
NullPointerExpection
19 小时前
数据库
·
人工智能
·
sql
·
算法
·
llm
·
llama
·
工作流
LLM大语言模型不适合统计算数,可以让大模型根据数据自己建表、插入数据、编写查询sql统计
例如有如下数据:表示的是某班级学生各科目的分数,假如我们想让大模型统计该班各科目成绩的总分,最能想到的方法就是编写如下的提示词扔给大模型:
Blessed_Li
20 小时前
llm
·
rag
·
ollama
·
graphrag
Linux系统安装部署GraphRAG完全指南
GraphRAG(Graph-based Retrieval-Augmented Generation)是微软开源的新一代知识图谱增强型检索生成技术,它通过构建实体关系网络来提升传统RAG的全局理解能力。与传统基于文本块的RAG不同,GraphRAG能够:
EdisonZhou
1 天前
llm
·
aigc
·
.net core
多Agent协作入门:顺序编排模式
大家好,我是Edison。上一篇我们学习了Semantic Kernel中的并发编排模式,它非常适合并行分析、独立子任务并集成决策的任务场景。今天,我们学习新的模式:顺序编排。
智泊AI
2 天前
llm
AI大模型:一文读懂强化学习(RL)中PPO&GRPO(通俗版)
01 开篇在强化学习(RL)中,如果我们只知道“做对了能拿多少分”,那往往还不够,因为单纯追求高分可能带来种种副作用,比如过度搜索、模型不稳定、甚至“走捷径”而偏离合理范围。
聚客AI
2 天前
人工智能
·
llm
·
掘金·日新计划
🚀解密向量空间:AI开发者必学的RAG架构与代码全解
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。核心组件作用:
用户71463575917
2 天前
llm
LLM应用全流程开发 全新技术+多案例实战+私有化部署
区别于简单的单一模型调用,完整的AI流程开发需要体系化的工程思维。以下是基于小红书仿制项目的全链路开发流程设计:
r0ad
2 天前
llm
从缓存 CAS 看Kimi K2使用的MuonClip优化器
开发|界面|引擎|交付|副驾——重写全栈法则:AI原生的倍速造应用流来自全栈程序员 nine 的探索与实践,持续迭代中。
Baihai_IDP
2 天前
人工智能
·
llm
·
claude
深度剖析 Claude 4 的系统提示词(保留提示词原文,并提供译文)
编者按: 想知道为什么 Claude 会“撒谎”说不了解自己的定价吗?为什么它的工具调用策略要根据用户查询的复杂度动态调整?
AI大模型
3 天前
llm
·
agent
·
mcp
MCP快速入门—快速构建自己的服务器
随着大语言模型(LLM)技术的快速发展,如何扩展其能力边界成为开发者关注的重点。MCP(Model Capability Protocol)作为一种协议标准,允许开发者构建自定义服务器来增强LLM的功能。
AI大模型
3 天前
程序员
·
llm
·
deepseek
拒绝“纸上谈兵”!这本《图解大模型:生成式 AI 原理与实战》太适合入门大模型了
今天推荐的这本大模型新书可就牛掰了,这不是一本“纸上谈兵”的 AI 教程,而是一本真正“看得懂、学得会、跑得动”的大模型实战指南。并且全书超过 300 幅全彩图示 × 实战级项目代码 × 中文独家 DeepSeek-R1 彩蛋内容,入门、进阶、实操、求职一步到位!
聚客AI
3 天前
人工智能
·
pytorch
·
llm
⚡手撕Transformer心脏:从RoPE到2025 Meta三线性体积编码的跃迁
本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院突破性设计:输出示例:
智泊AI
3 天前
llm
多模态对比学习模型CLIP原理是什么?(讲人话版)
CLIP(Contrastive Language-lmage Pre-training)CLIP是由OpenAl提出的多模态对比学习模型通过400万组互联网图文对预训练,学习图像与文本的联合语义空间。
G皮T
3 天前
人工智能
·
ai
·
llm
·
大语言模型
·
dify
·
ai agent
·
智能体
【人工智能】通过 Dify 构建智能助手
智能助手(Agent Assistant),利用大语言模型的推理能力,能够自主对复杂的人类任务进行 目标规划、任务拆解、工具调用、过程迭代,并在没有人类干预的情况下完成任务。
JimmysAIPG
3 天前
llm
从零训练大模型之模型升级版搭建及训练总结(下)
经过文章《从零训练大模型之模型升级版搭建及训练(上)》和《从零训练大模型之模型升级版搭建及训练(中)》的努力,我们已经完成了模型代码的编写。这一篇我们将分享最终的训练结果,并和《从零训练大模型之模型搭建》搭建的模型进行结果对比。按照《Attention Is All You Need》编写的模型,我们称之为V1版模型,对应的这一版的升级版模型我们称之为V2版模型。