基于Transformer的路径规划 - 第五篇 GPT生成策略_解码方法优化

上一篇:基于Transformer的路径规划 - 第四篇 GPT模型优化


在上一篇中,我尝试优化GPT路径生成模型,但没有成功。在随机生成的测试集上,路径规划成功率只有99%左右。而使用传统的路径规划算法,例如A*,路径规划成功率能达到100%。显然,如果想让模型具备一定的实用价值,还需要继续提升指标。在本篇中,我将尝试通过优化GPT生成策略(在有些文章中又称为解码策略)来提升路径规划成功率。

我们将生成的路径用Tree来表示,在贪心搜索中,每次选择置信度最大的节点,因此只会生成一条路径。如果考虑置信度大于设定阈值ε的所有节点,那会是什么情况呢?

以下图为例:

若使用贪心搜索,生成的路径会发生碰撞,如下图所示:

若考虑置信度大于0.1的所有节点,则可以生成7条路径,如下图所示:

可视化结果如下:

可以看到,除了贪心搜索得到的路径发生了碰撞外,其它6条路径都是正确的。

这个实验结果让人看到了GPT模型在路径规划问题上的潜力:我们可以设置更低的阈值ε,一次生成多条路径,然后选择最好的一条路径,这样路径规划成功率就逼近100%了。


实验总结:

  1. 基于Transformer的模型至少能够解决简单的路径规划问题
  2. GPT生成模型需要搭配合适的生成策略才能挖掘出模型的潜力

全篇完

原文链接 请勿转载

相关推荐
再玩一会儿看代码8 分钟前
如何理解神经网络中的权重参数?从一张图看懂模型参数量计算
人工智能·经验分享·python·深度学习·神经网络·机器学习
炜宏资料库14 分钟前
【专家观点】河钢数字:工业AI质检助力生产制造企业持续提质降本增效
人工智能·制造
核数聚16 分钟前
给四足机器人装上 “智慧大脑”!核数聚具身数据集,让园区巡检又快又稳
人工智能·机器学习·ai·机器人
wuxinyan12326 分钟前
大模型学习之路007:RAG 零基础入门教程(第四篇):生成侧核心技术与大模型集成
人工智能·学习·rag
亚鲁鲁27 分钟前
02-启动流程
人工智能
kcuwu.1 小时前
机器学习入门:线性回归完全指南(含波士顿房价预测案例)
人工智能·机器学习·线性回归
幸运的大号暖贴1 小时前
解决Vibe Coding时Idea经常不自动git add问题
java·人工智能·git·intellij-idea·claudecode·opencode
MonkeyKing_sunyuhua1 小时前
什么是服务端 VAD 端点检测
人工智能·语音识别
ascarl20101 小时前
Linux.do 帖子整理:AI 调用 Chrome DevTools 调试前端页面
linux·前端·人工智能
qxq_sunshine1 小时前
从 CNN 到 Agent:给 DL 工程师的“智能体”入门黑话指南(概念篇)
人工智能·神经网络·cnn