基于Transformer的路径规划 - 第五篇 GPT生成策略_解码方法优化

aiblog2024-11-04 16:54

上一篇：基于Transformer的路径规划 - 第四篇 GPT模型优化

在上一篇中，我尝试优化GPT路径生成模型，但没有成功。在随机生成的测试集上，路径规划成功率只有99%左右。而使用传统的路径规划算法，例如A*，路径规划成功率能达到100%。显然，如果想让模型具备一定的实用价值，还需要继续提升指标。在本篇中，我将尝试通过优化GPT生成策略（在有些文章中又称为解码策略）来提升路径规划成功率。

我们将生成的路径用Tree来表示，在贪心搜索中，每次选择置信度最大的节点，因此只会生成一条路径。如果考虑置信度大于设定阈值ε的所有节点，那会是什么情况呢？

以下图为例：

若使用贪心搜索，生成的路径会发生碰撞，如下图所示：

若考虑置信度大于0.1的所有节点，则可以生成7条路径，如下图所示：

可视化结果如下：

可以看到，除了贪心搜索得到的路径发生了碰撞外，其它6条路径都是正确的。

这个实验结果让人看到了GPT模型在路径规划问题上的潜力：我们可以设置更低的阈值ε，一次生成多条路径，然后选择最好的一条路径，这样路径规划成功率就逼近100%了。

实验总结：

基于Transformer的模型至少能够解决简单的路径规划问题
GPT生成模型需要搭配合适的生成策略才能挖掘出模型的潜力

全篇完

原文链接请勿转载

上一篇：《Qwen2-VL》论文精读【下】：发表于2024年10月 Qwen2-VL 迅速崛起 | 性能与GPT-4o和Claude3.5相当

下一篇：提示工程：GPT写一篇短篇小说~文心一言

热门推荐

01UV安装并设置国内源 02KGG转MP3工具|非KGM文件|解密音频 03【2025.08.06最新版】Android Studio下载、安装及配置记录（自动下载sdk）04Qwen3-Coder 快速上手教程 | Qwen Code + Claude Code 052025最新国内服务器可用docker源仓库地址大全（2025年8月更新）06蜘蛛磁力搜索引擎大全，如何使用蜘蛛磁力查找磁力链接 07TRAE 规则（Rules）配置指南：个人习惯、团队规范与最佳实践 08TRAE Rules 实践：为项目配置 6A 工作流 09全球最强模型Grok4，国内已可免费使用！（附教程）10NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南