241125学习日志——[CSDIY] [InternStudio] 大模型训练营 [17]

CSDIY:这是一个非科班学生的努力之路,从今天开始这个系列会长期更新,(最好做到日更),我会慢慢把自己目前对CS的努力逐一上传,帮助那些和我一样有着梦想的玩家取得胜利!!!

第一弹:Cpp零基础学习【30 DAYS 从0到1】

第二弹:Cpp刷题文档【LeetCode】

第三弹:Go开发入门【字节后端青训营】

第四弹:Cpp简单项目开发【黑马Rookie】

第五弹:数据结构绪论【数据结构与算法】

第六弹:Go工程实践【字节后端青训营】

第七弹:高质量编程和性能调优【字节后端青训营】

第八弹:Linux 基础知识【书生大模型训练营】

第九弹:Python 基础知识【书生大模型训练营】

第十弹:Git 基础知识【书生大模型训练营】

第十一弹:玩转HF/魔搭/魔乐社区【书生大模型训练营】

第十二弹:书生大模型全链路开源体系【书生大模型训练营】

第十三弹:玩转书生「多模态对话」与「AI搜索」产品【书生大模型训练营】

第十四弹:浦语提示词工程实践【书生大模型训练营】

第十五弹:HTTP 框架修炼之道【字节后端青训营】

第十六弹:打开抖音会发生什么【字节后端青训营】

第十七弹:将我的服务开放给用户【字节后端青训营】

第十八弹:InternLM + LlamaIndex RAG 实践【书生大模型训练营】

第4关 L1G4000 InternLM + LlamaIndex RAG 实践

1. 前置知识

正式介绍检索增强生成(Retrieval Augmented Generation,RAG)技术以前,大家不妨想想为什么会出现这样一个技术。 给模型注入新知识的方式,可以简单分为两种方式,一种是内部的,即更新模型的权重,另一个就是外部的方式,给模型注入格外的上下文或者说外部信息,不改变它的的权重。 第一种方式,改变了模型的权重即进行模型训练,这是一件代价比较大的事情,大语言模型具体的训练过程,可以参考InternLM2技术报告。 第二种方式,并不改变模型的权重,只是给模型引入格外的信息。类比人类编程的过程,第一种方式相当于你记住了某个函数的用法,第二种方式相当于你阅读函数文档然后短暂的记住了某个函数的用法。

对比两种注入知识方式,第二种更容易实现。RAG 正是这种方式。它能够让基础模型实现非参数知识更新,无需训练就可以掌握新领域的知识。本次课程选用了 LlamaIndex 框架。LlamaIndex 是一个上下文增强的 LLM 框架,旨在通过将其与特定上下文数据集集成,增强大型语言模型(LLMs)的能力。它允许您构建应用程序,既利用 LLMs 的优势,又融入您的私有或领域特定信息。

RAG 效果比对

由于xtuner是一款比较新的框架, InternLM2-Chat-1.8B 训练数据库中并没有收录到它的相关信息。左图中问答均未给出准确的答案。右图未对 InternLM2-Chat-1.8B 进行任何增训的情况下,通过 RAG 技术实现的新增知识问答。

2. 闯关

2.1 任务一:浦语 API+LlamaIndex 实践

2.1.1 不使用 LlamaIndex RAG(仅API)

可见GPT不具备相关知识

2.1.2 使用 API+LlamaIndex

可见RAG库使得GPT具有回答问题的能力了

2.1.3 LlamaIndex web

添加可视化网页功能...毕竟终端是有点丑的。

换个问题,发现仍然具有回答能力。

2.2 任务二:本地部署InternLM+LlamaIndex实践

2.2.1 LlamaIndex HuggingFaceLLM

回答的效果并不好,并不是我们想要的 xtuner。

2.2.2 LlamaIndex RAG

借助 RAG 技术后,就能获得我们想要的答案了。

2.2.3 LlamaIndex web

碎碎念:大部分时间都在 Debug...做一些开源项目我觉得大多数时候也不是在写代码,而是在Debug,真的很清楚感受到 GPT带来的便利...以及Debug的恼火...看来也有必要买一些哲学的书看一看...很多时候还是会崩溃...心态这方面还得练

与君共勉。

相关推荐
zhuyixiangyyds2 小时前
day21和day22学习Pandas库
笔记·学习·pandas
每次的天空2 小时前
Android学习总结之算法篇四(字符串)
android·学习·算法
背影疾风4 小时前
C++学习之路:指针基础
c++·学习
苏克贝塔4 小时前
CMake学习--Window下VSCode 中 CMake C++ 代码调试操作方法
c++·vscode·学习
odoo中国5 小时前
深度学习 Deep Learning 第15章 表示学习
人工智能·深度学习·学习·表示学习
电星托马斯5 小时前
C++中顺序容器vector、list和deque的使用方法
linux·c语言·c++·windows·笔记·学习·程序人生
清晨朝暮5 小时前
【算法学习计划】贪心算法(下)
学习
yanxy5127 小时前
【TS学习】(18)分发逆变推断
前端·学习·typescript
Hellyc7 小时前
SpringMVC响应数据:页面跳转与回写数据
java·前端·学习
Qian_ShouYi7 小时前
MATLAB 代码学习
学习·算法·matlab