机械学习—零基础学习日志(项目实践01)

llM项目分类与原理解析

Prompt项目

直接产出一些具体的文本与信息,使用markdown的格式。

对prompt进行较好的格式输出,固定格式。

ChatPaper

快速获取论文内容,然后了解对应的信息,判断是否有必要阅读这一篇论文

ChatBI,ChatEXcel类

将用户输入的信息文本,转化为SQL语句,用户上传数据文件,在使用指令对数据进行操作

直接将text转化为代码文件,直接用代码操作表格

ChatPPT

逻辑:PPT是一种文件格式,理解可以通过代码操作文件就可以。

格式:确定PPT模版,例如第一种PPT是需要一张图片,设置图片的透明度等等,其实就确定了第一张PPT的格式就行。

内容:使用大模型能力,输出大量文本信息,输出主主题,子标题,结合PPT格式输出。

如果要处理的数据很多,超过token限制怎么办?

第一,裁剪文本,将一万字文本裁剪为更小的文本,进行信息总结,但是会丢失很多信息

第二:

将人类世界的文本,转变的那个向量空间?

对于专业领域,最好训练自己的embedding模型

遇到通用模型解决不了的问题怎么办?

大神推荐的入门链接放这里了:

https://github.com/JessyTsui/awesome_LLM_beginner

datawhale,有比较多的项目分类,也有众多的学习者,大家在这里是可以找到不错的伙伴的。

非常推荐!

相关推荐
机器之心8 分钟前
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长
人工智能·openai
该用户已不存在13 分钟前
Mojo vs Python vs Rust: 2025年搞AI,该学哪个?
后端·python·rust
算家计算21 分钟前
AI配音革命!B站最新开源IndexTTS2本地部署教程:精准对口型,情感随心换
人工智能·开源·aigc
量子位25 分钟前
马斯克周末血裁xAI 500人
人工智能·ai编程
算家计算33 分钟前
OpenAI最强编程模型GPT-5-Codex发布!可独立编程7小时,编程效率提升10倍
人工智能·ai编程·资讯
NAGNIP2 小时前
大模型框架性能优化策略:延迟、吞吐量与成本权衡
算法
站大爷IP2 小时前
Java调用Python的5种实用方案:从简单到进阶的全场景解析
python
聚客AI2 小时前
🌟大模型为什么产生幻觉?预训练到推理的漏洞全揭秘
人工智能·llm·掘金·日新计划
Juchecar2 小时前
一文讲清 nn.Sequential 等容器类
人工智能
阿里云云原生3 小时前
如何快速看懂「祖传项目」?Qoder 强势推出新利器
人工智能