机械学习—零基础学习日志(项目实践01)

llM项目分类与原理解析

Prompt项目

直接产出一些具体的文本与信息,使用markdown的格式。

对prompt进行较好的格式输出,固定格式。

ChatPaper

快速获取论文内容,然后了解对应的信息,判断是否有必要阅读这一篇论文

ChatBI,ChatEXcel类

将用户输入的信息文本,转化为SQL语句,用户上传数据文件,在使用指令对数据进行操作

直接将text转化为代码文件,直接用代码操作表格

ChatPPT

逻辑:PPT是一种文件格式,理解可以通过代码操作文件就可以。

格式:确定PPT模版,例如第一种PPT是需要一张图片,设置图片的透明度等等,其实就确定了第一张PPT的格式就行。

内容:使用大模型能力,输出大量文本信息,输出主主题,子标题,结合PPT格式输出。

如果要处理的数据很多,超过token限制怎么办?

第一,裁剪文本,将一万字文本裁剪为更小的文本,进行信息总结,但是会丢失很多信息

第二:

将人类世界的文本,转变的那个向量空间?

对于专业领域,最好训练自己的embedding模型

遇到通用模型解决不了的问题怎么办?

大神推荐的入门链接放这里了:

https://github.com/JessyTsui/awesome_LLM_beginner

datawhale,有比较多的项目分类,也有众多的学习者,大家在这里是可以找到不错的伙伴的。

非常推荐!

相关推荐
CF14年老兵11 分钟前
Python万物皆对象:从懵懂到顿悟的奇妙之旅
后端·python·trae
这里有鱼汤14 分钟前
发现个用《道德经》+价值投资大咖的智慧,做A股的AI诊股神器,居然还开源了
python
cwn_17 分钟前
牛津大学xDeepMind 自然语言处理(1)
人工智能·深度学习·机器学习·自然语言处理
前端双越老师24 分钟前
【干货】使用 langChian.js 实现掘金“智能总结” 考虑大文档和 token 限制
人工智能·langchain·node.js
鸢栀w39 分钟前
前端css学习笔记7:各种居中布局&空白问题
前端·css·笔记·学习·尚硅谷网课
leiya_16341 分钟前
私有化部署本地大模型+function Calling+本地数据库
人工智能·ai·大模型
墩墩同学41 分钟前
【LeetCode题解】LeetCode 74. 搜索二维矩阵
算法·leetcode·二分查找
陈天伟教授42 分钟前
(二)Python + 地球信息科学与技术 (GeoICT)=?
开发语言·python
SunnyKriSmile1 小时前
输入10个数并求最大值
c语言·算法
汤永红1 小时前
week2-[循环嵌套]数位和为m倍数的数
c++·算法·信睡奥赛