让AI帮我玩解密益智游戏,AI亦有差距

在玩e宝送的机械迷城,给了一张游戏里面的小游戏截图,让ai帮我找出期望的填充路径,只有chatgpt一次就算出了结果,coze大概也许勉强算是,其它的ai都是没有给出结果。

prompt

感兴趣的可以试试更多的其它模型,看看它们的解决方案,哪个能够一次性给出答案。

也可以调整prompt,让所有ai都能够正常给出结果

text 复制代码
这是一个类似一笔画的游戏,红色格子相当于阻碍,需要一笔完成空白格子的填充,不能折返,到了尽头才能转向,不能够从地图边缘连接,请找出最终的路径,通过md的单元格填写递增的数字来表示整个路径

可以自行截取部分图片

结果

有穷举、有代码、有瞎扯胡编乱造、有无法理解

  • chatgpt:一把过,
  • coze:第一次会话n次尝试,人都麻了,才最终勉强成功,第二次会话多次失败
  • yuanbao:一把不过
  • cluade:sonnet4、opus4.1 一把不过
  • deepseek:不支持图片,只能吟诗作对
  • kimi:无话可说

实验

coze

会话1

这是一开始的尝试,后面开始整理了下prompt 去其他ai进行尝试

5x5方格绿色填充通关 - 扣子空间 space.coze.cn/s/i7ak1Ybd4...

coze一开始只知道从(1,1)开始出发,死活都得不出结果,后面告诉它可以修改起点,它通过代码才给出了答案,前期一直是直接通过文本或者视觉理解在那里忽悠自己忽悠我

最终成功(伪)

最终我在它的中间生成的文档找到了正确结果,但是最终结果是在这个正确结果上又优化成了错误的。

期间错误

这些错误,给我的感觉就是coze自己骗自己

  • 多出了红色格子
  • 不连续
  • 计数错误
  • 有空格
  • 从右侧直接连接到左侧
  • 。。。。

最离谱的解释

会话2-失败

重新开启新的会话,使用修改后的prompt,尝试好几次还是失败

一笔填充空白格找路径 - 扣子空间 space.coze.cn/s/RbJO_Ctu7...

chatgpt

一把过,自行通过程序完成了计算,我以为也要很多次调试,结果它一次就搞定了

chatgpt.com/s/t_68b2d68...

yuanbao

穷举,但是失败了

"这是一个类似一笔画的游戏,红色格子相当于..."点击查看元宝的回答 yuanbao.tencent.com/bot/app/sha...

cluade

Sonnet4

不知道在想什么

Opus4.1

又是穷举,还是失败

kimi

K2

不支持图片让我用k1.5

K1.5

k1.5 结果连图片识别都没达到预期 -_-||

游戏结果

相关推荐
GitLqr9 小时前
AI洞察 | Nano banana 图像新玩法,GPT-Realtime 实时语音交互革新
google·openai·gemini
IAM四十二16 小时前
LLM多模态嵌入 - 图片嵌入
人工智能·llm·openai
机器之心2 天前
时代2025 AI百人榜出炉:任正非、梁文锋、王兴兴、彭军、薛澜等入选,华人影响力爆棚
人工智能·openai
机器之心2 天前
谢赛宁回忆七年前OpenAI面试:白板编程、五小时会议,面完天都黑了
人工智能·openai
Json_2 天前
使用springboot开发-AI智能体平台管理系统,统一管理各个平台的智能体并让智能体和AI语音设备通信,做一个属于自己的小艾同学~
人工智能·spring boot·openai
机器之心3 天前
元石科技正式发布问小白5,性能直追GPT-5
人工智能·openai
XinZong3 天前
【OpenAI】获取OpenAI API Key的多种方式全攻略:多模型API入门到精通,再到详解教程!
aigc·openai·ai编程
机器之心3 天前
AAAI-26投稿量爆炸:近3万篇论文,2万来自中国,评审系统都快崩了
人工智能·openai
新智元3 天前
刚刚,清华姚班校友陈丹琦加入 Thinking Machines!和北大翁荔做同事
人工智能·openai