文本生成解码策略

解码策略

  1. sample实现了怎样的功能

不是直接选择概率最大的token,而是根据多项式分布进行采样获得下一个token

这里的概率通过设置一些策略,进行处理。例如,解码最小长度(当长度小于该值的时候,eos的采样概率为0),top-k设置(小于top-k阈值的采样概率为0),温度参数(对采样概率进一步处理)

  1. contrastive_search实现了怎样的功能

为了增加解码的多样性,在生成token时,即考虑生成概率分布,还要考虑和前面生成的token之间的差异性,选择相似度较小的token

相关推荐
wukangjupingbb几秒前
在 Windows 系统上一键部署 **Moltbot**
人工智能·windows·agent
rainbow724244几秒前
系统学习AI的标准化路径,分阶段学习更高效
大数据·人工智能·学习
Guheyunyi15 分钟前
节能降耗系统从“经验直觉”推向“精准智控”
大数据·数据库·人工智能·科技·信息可视化
梦梦代码精15 分钟前
这玩意儿是干啥的?AI应用版的 WordPress
人工智能
爱吃泡芙的小白白17 分钟前
机器学习输出层设计精要:从原理到产业实践
人工智能·机器学习
阡陌..19 分钟前
pytorch模型训练使用多GPU执行报错:Bus error (core dumped)(未解决)
人工智能·pytorch·python
晓晓不觉早26 分钟前
五大新一代大模型实测
人工智能
L***一31 分钟前
大数据与财务管理专业就业方向与职业发展路径探析——基于数字化时代复合型人才需求视角
人工智能
Testopia33 分钟前
AI编程实例 -- 数据可视化实战教程
人工智能·信息可视化·ai编程
跨境摸鱼38 分钟前
选品别只看“需求”,更要看“供给”:亚马逊新思路——用“供给断层”挑出更好打的品
大数据·人工智能·跨境电商·亚马逊·跨境·营销策略