机械学习—零基础学习日志(项目实践01)

llM项目分类与原理解析

Prompt项目

直接产出一些具体的文本与信息,使用markdown的格式。

对prompt进行较好的格式输出,固定格式。

ChatPaper

快速获取论文内容,然后了解对应的信息,判断是否有必要阅读这一篇论文

ChatBI,ChatEXcel类

将用户输入的信息文本,转化为SQL语句,用户上传数据文件,在使用指令对数据进行操作

直接将text转化为代码文件,直接用代码操作表格

ChatPPT

逻辑:PPT是一种文件格式,理解可以通过代码操作文件就可以。

格式:确定PPT模版,例如第一种PPT是需要一张图片,设置图片的透明度等等,其实就确定了第一张PPT的格式就行。

内容:使用大模型能力,输出大量文本信息,输出主主题,子标题,结合PPT格式输出。

如果要处理的数据很多,超过token限制怎么办?

第一,裁剪文本,将一万字文本裁剪为更小的文本,进行信息总结,但是会丢失很多信息

第二:

将人类世界的文本,转变的那个向量空间?

对于专业领域,最好训练自己的embedding模型

遇到通用模型解决不了的问题怎么办?

大神推荐的入门链接放这里了:

https://github.com/JessyTsui/awesome_LLM_beginner

datawhale,有比较多的项目分类,也有众多的学习者,大家在这里是可以找到不错的伙伴的。

非常推荐!

相关推荐
Charles Ray22 分钟前
C++学习笔记 —— 内存分配 new
c++·笔记·学习
重生之我在20年代敲代码23 分钟前
strncpy函数的使用和模拟实现
c语言·开发语言·c++·经验分享·笔记
爱上语文24 分钟前
Springboot的三层架构
java·开发语言·spring boot·后端·spring
m0_6090004231 分钟前
向日葵好用吗?4款稳定的远程控制软件推荐。
运维·服务器·网络·人工智能·远程工作
我要吐泡泡了哦1 小时前
GAMES104:15 游戏引擎的玩法系统基础-学习笔记
笔记·学习·游戏引擎
骑鱼过海的猫1231 小时前
【tomcat】tomcat学习笔记
笔记·学习·tomcat
开MINI的工科男1 小时前
深蓝学院-- 量产自动驾驶中的规划控制算法 小鹏
人工智能·机器学习·自动驾驶
waterHBO2 小时前
python 爬虫 selenium 笔记
爬虫·python·selenium
limingade3 小时前
手机实时提取SIM卡打电话的信令和声音-新的篇章(一、可行的方案探讨)
物联网·算法·智能手机·数据分析·信息与通信
编程零零七3 小时前
Python数据分析工具(三):pymssql的用法
开发语言·前端·数据库·python·oracle·数据分析·pymssql