机械学习—零基础学习日志(项目实践01)

llM项目分类与原理解析

Prompt项目

直接产出一些具体的文本与信息,使用markdown的格式。

对prompt进行较好的格式输出,固定格式。

ChatPaper

快速获取论文内容,然后了解对应的信息,判断是否有必要阅读这一篇论文

ChatBI,ChatEXcel类

将用户输入的信息文本,转化为SQL语句,用户上传数据文件,在使用指令对数据进行操作

直接将text转化为代码文件,直接用代码操作表格

ChatPPT

逻辑:PPT是一种文件格式,理解可以通过代码操作文件就可以。

格式:确定PPT模版,例如第一种PPT是需要一张图片,设置图片的透明度等等,其实就确定了第一张PPT的格式就行。

内容:使用大模型能力,输出大量文本信息,输出主主题,子标题,结合PPT格式输出。

如果要处理的数据很多,超过token限制怎么办?

第一,裁剪文本,将一万字文本裁剪为更小的文本,进行信息总结,但是会丢失很多信息

第二:

将人类世界的文本,转变的那个向量空间?

对于专业领域,最好训练自己的embedding模型

遇到通用模型解决不了的问题怎么办?

大神推荐的入门链接放这里了:

https://github.com/JessyTsui/awesome_LLM_beginner

datawhale,有比较多的项目分类,也有众多的学习者,大家在这里是可以找到不错的伙伴的。

非常推荐!

相关推荐
xyz_CDragon1 分钟前
OpenClaw 局域网调用 Ollama 本地大模型:完整配置与踩坑指南
python·ai编程·集成学习·ollama·deepseek·openclaw
threelab3 分钟前
Three.js 几何图形变换 | 三维可视化 / AI 提示词
开发语言·前端·javascript·人工智能·3d·着色器
MartinYeung54 分钟前
[论文学习]无资料选择性遗忘:透过模型反演实现 LLM 的资料免隐私保护(DFSU)
学习
道友可好4 分钟前
写给 AI 的入职手册,AGENTS.md
前端·人工智能·后端
极光代码工作室5 分钟前
基于NLP的论文关键词提取系统
python·深度学习·自然语言处理·nlp
无限进步_6 分钟前
Linux进程等待——wait、waitpid与僵尸进程
linux·运维·服务器·开发语言
碳基硅坊6 分钟前
NVIDIA RTX Spark:个人电脑的重新定义
人工智能·rtx spark
海梨花7 分钟前
字节面试高频算法题
java·算法·面试·职场和发展
刘大猫.8 分钟前
宇树科技回应联合英伟达开发“H2+”人形机器人,预计今年下半年正式亮相
人工智能·科技·机器学习·ai·chatgpt·机器人·大模型
野生技术架构师9 分钟前
Java 23 种设计模式:从踩坑到精通 —— 开篇及系列介绍
java·开发语言·设计模式