基于Transformer的路径规划 - 第五篇 GPT生成策略_解码方法优化

上一篇:基于Transformer的路径规划 - 第四篇 GPT模型优化


在上一篇中,我尝试优化GPT路径生成模型,但没有成功。在随机生成的测试集上,路径规划成功率只有99%左右。而使用传统的路径规划算法,例如A*,路径规划成功率能达到100%。显然,如果想让模型具备一定的实用价值,还需要继续提升指标。在本篇中,我将尝试通过优化GPT生成策略(在有些文章中又称为解码策略)来提升路径规划成功率。

我们将生成的路径用Tree来表示,在贪心搜索中,每次选择置信度最大的节点,因此只会生成一条路径。如果考虑置信度大于设定阈值ε的所有节点,那会是什么情况呢?

以下图为例:

若使用贪心搜索,生成的路径会发生碰撞,如下图所示:

若考虑置信度大于0.1的所有节点,则可以生成7条路径,如下图所示:

可视化结果如下:

可以看到,除了贪心搜索得到的路径发生了碰撞外,其它6条路径都是正确的。

这个实验结果让人看到了GPT模型在路径规划问题上的潜力:我们可以设置更低的阈值ε,一次生成多条路径,然后选择最好的一条路径,这样路径规划成功率就逼近100%了。


实验总结:

  1. 基于Transformer的模型至少能够解决简单的路径规划问题
  2. GPT生成模型需要搭配合适的生成策略才能挖掘出模型的潜力

全篇完

原文链接 请勿转载

相关推荐
暴躁小师兄数据学院3 分钟前
【AI大模型应用开发工程师特训笔记】第04讲(第4章):运算符
人工智能·笔记·机器学习
LCG元5 分钟前
从零搭建手机可访问的本地私人AI聊天系统:基于Ollama + OpenWebUI
人工智能·智能手机
土星云SaturnCloud5 分钟前
土星云AI边缘计算的算法应用-人脸检测
服务器·人工智能·ai·边缘计算
金智维科技官方6 分钟前
财务智能体在财务领域的应用
人工智能·ai·自动化·财务·智能体
xixixi777777 分钟前
Token 经济重构价值分配:中国移动成核心枢纽,算网安一体化按需计费普惠中小企业
人工智能·ai·大模型·云计算·算力·token·流量
凯丨8 分钟前
让 AI 通宵优化神经网络:Karpathy autoresearch 的设计哲学与启示
人工智能·深度学习·神经网络
浦信仿真大讲堂9 分钟前
【一文读懂系列】-达索仿真软件怎么选?
人工智能·仿真软件·达索仿真·达索软件
ZFSS10 分钟前
Pika 视频生成 API 集成教程
java·数据库·人工智能·ai·音视频
名字不好奇10 分钟前
多模态大模型原理:一切皆向量,一切皆可生成
llm·transformer
jarvisuni11 分钟前
魔改的DeepSeek桌面版成了!
人工智能·ai编程