基于Transformer的路径规划 - 第五篇 GPT生成策略_解码方法优化

上一篇:基于Transformer的路径规划 - 第四篇 GPT模型优化


在上一篇中,我尝试优化GPT路径生成模型,但没有成功。在随机生成的测试集上,路径规划成功率只有99%左右。而使用传统的路径规划算法,例如A*,路径规划成功率能达到100%。显然,如果想让模型具备一定的实用价值,还需要继续提升指标。在本篇中,我将尝试通过优化GPT生成策略(在有些文章中又称为解码策略)来提升路径规划成功率。

我们将生成的路径用Tree来表示,在贪心搜索中,每次选择置信度最大的节点,因此只会生成一条路径。如果考虑置信度大于设定阈值ε的所有节点,那会是什么情况呢?

以下图为例:

若使用贪心搜索,生成的路径会发生碰撞,如下图所示:

若考虑置信度大于0.1的所有节点,则可以生成7条路径,如下图所示:

可视化结果如下:

可以看到,除了贪心搜索得到的路径发生了碰撞外,其它6条路径都是正确的。

这个实验结果让人看到了GPT模型在路径规划问题上的潜力:我们可以设置更低的阈值ε,一次生成多条路径,然后选择最好的一条路径,这样路径规划成功率就逼近100%了。


实验总结:

  1. 基于Transformer的模型至少能够解决简单的路径规划问题
  2. GPT生成模型需要搭配合适的生成策略才能挖掘出模型的潜力

全篇完

原文链接 请勿转载

相关推荐
大模型任我行21 分钟前
人大:熵引导的LLM有限数据训练
人工智能·语言模型·自然语言处理·论文笔记
weixin_4684668529 分钟前
YOLOv13结合代码原理详细解析及模型安装与使用
人工智能·深度学习·yolo·计算机视觉·图像识别·目标识别·yolov13
蹦蹦跳跳真可爱58940 分钟前
Python----大模型(GPT-2模型训练加速,训练策略)
人工智能·pytorch·python·gpt·embedding
xwill*42 分钟前
π∗0.6: a VLA That Learns From Experience
人工智能·pytorch·python
jiayong231 小时前
知识库概念与核心价值01
java·人工智能·spring·知识库
雨轩剑1 小时前
做 AI 功能不难,难的是把 App 发布上架
人工智能·开源软件
独自破碎E1 小时前
解释一下RAG中的Rerank
gpt·语言模型
Tezign_space1 小时前
AI智能体赋能实践:从提示工程到上下文工程的架构演进
人工智能·架构·agentic ai·上下文工程·大模型智能体·长程任务·模型注意力预算
..过云雨2 小时前
17-2.【Linux系统编程】线程同步详解 - 条件变量的理解及应用
linux·c++·人工智能·后端
kalvin_y_liu2 小时前
【2026年经济周期关键节点案例分析】
人工智能