我的实验路子是想试试能不能帮我建一下实物模型
SO
我选择了一个成都环球中心的网图
但是生成的结果掺不忍睹,但是看demo来看,似乎如果你能给出一张干净的提示图片,他还是能做出一些东西的
这里我延申的思考是这个物体他如果没看过背面,他怎么猜?
他产出的物品为啥都是一张图的,我还是不太理解
但是如果多张图片,其实又和一个多图3D重建的能力似乎重复了
或者我感觉这个功能需求两张图片 正上面45°加背下面另外一个45°
以上面环球为例子
第一个视角就是就右边那个边的头上
另一个是对角线对过去的地下那个视角
刚好两个视角看完所有东西。
感觉这比较容易得到真正的结果?
或许有机缘再了解一些深层次一点的AI的知识再看吧
或许事情不是我理解的那样