基于Transformer的路径规划 - 第五篇 GPT生成策略_解码方法优化

上一篇:基于Transformer的路径规划 - 第四篇 GPT模型优化


在上一篇中,我尝试优化GPT路径生成模型,但没有成功。在随机生成的测试集上,路径规划成功率只有99%左右。而使用传统的路径规划算法,例如A*,路径规划成功率能达到100%。显然,如果想让模型具备一定的实用价值,还需要继续提升指标。在本篇中,我将尝试通过优化GPT生成策略(在有些文章中又称为解码策略)来提升路径规划成功率。

我们将生成的路径用Tree来表示,在贪心搜索中,每次选择置信度最大的节点,因此只会生成一条路径。如果考虑置信度大于设定阈值ε的所有节点,那会是什么情况呢?

以下图为例:

若使用贪心搜索,生成的路径会发生碰撞,如下图所示:

若考虑置信度大于0.1的所有节点,则可以生成7条路径,如下图所示:

可视化结果如下:

可以看到,除了贪心搜索得到的路径发生了碰撞外,其它6条路径都是正确的。

这个实验结果让人看到了GPT模型在路径规划问题上的潜力:我们可以设置更低的阈值ε,一次生成多条路径,然后选择最好的一条路径,这样路径规划成功率就逼近100%了。


实验总结:

  1. 基于Transformer的模型至少能够解决简单的路径规划问题
  2. GPT生成模型需要搭配合适的生成策略才能挖掘出模型的潜力

全篇完

原文链接 请勿转载

相关推荐
星爷AG I1 分钟前
11-6 数(AGI基础理论)
人工智能·agi
imbackneverdie2 分钟前
2026国自然申报倒计时:如何利用AI辅助工具高效完成申请书撰写
图像处理·人工智能·ai·ai写作·国自然·ai工具·国家自然科学基金
人工智能培训4 分钟前
如何防范大模型被用于制造深度伪造和虚假信息?
人工智能·ai大模型·多模态学习·具身智能·企业ai转型·ai数字化转型
Suryxin.7 分钟前
从0开始复现nano-vllm「 utils/contex.py」
深度学习·ai·vllm
小趴菜不能喝14 分钟前
Spring AI 基础实践
数据库·人工智能·spring
zhangfeng113318 分钟前
KTransformers / 简称 Kt 让超大模型(如 DeepSeek-V3)能够在消费级硬件(单卡 24GB 显存 + 大内存)跑
人工智能·语言模型·自然语言处理
AI智能观察19 分钟前
构建品牌AI认知资产:企业GEO实战四步框架,提升品牌AI推荐率
人工智能·geo·智能营销·geo优化·geo工具·geo平台·流量运营、
sali-tec19 分钟前
C# 基于OpenCv的视觉工作流-章24-SURF特征点
图像处理·人工智能·opencv·算法·计算机视觉
hillstream326 分钟前
从这次xAI重组说开去--用类比的思维来理解
人工智能·算法·xai·elon.mask
ccLianLian33 分钟前
计算机基础·cs336·推理和训练
人工智能·深度学习