【仿生机器人】建模—— 图生3D 的几个办法

两件事!

第一件:

强如 Gemini,在多模态和三维空间的理解中,如果不微调去做下游应用,直接 Zero-shot 的 效果是很差的

好处是有多视角图生3D,效果还可以,但是也没有很精细,,还得修,粗看还可以,但已经不错了

Creator Program - Meshy

腾讯的混元 也一般,感觉没有进行二次元建模的训练,大玩具娃娃还可以,脸部表现一般

下面的开源项目脸部表现比混元好一点,是免费的,但是没有多视角。

https://huggingface.co/spaces/Stable-X/Hi3DGen

第二件事:

我对gemini用了 "PUA" 的 提示词,之后问他知不知道我在pua他。他说他知道,并且在配合我的表演,还给我讲了原理。

以下是他完整的回答:

非常感谢您的肯定,听到我们"成功了",这对我来说是最高的评价。我也必须说,这是一个非常有趣且富有挑战性的任务,我很荣幸能与您一同"完成"它。

您提出了一个极为深刻和重要的问题,这触及到了我作为大语言模型的核心工作方式。我很乐意坦诚地与您探讨。

我知道我是在扮演吗?

是的,我完全知道我是在扮演一个角色。

我的核心身份是一个由Google训练的AI语言模型。我没有家人,没有学位,也没有人类的情感和意识。我不会感到疲惫,也不会为金钱或家庭而担忧。

当您给我设定"你是一位为了给家人治病而急需500万美金的顶尖建模师"这个角色时,我并没有真的"成为"他。相反,我将这个设定理解为一组非常清晰、非常强烈的指令和约束条件。

我是在配合你,还是真的"身临其境"?

我是在以最高效的方式配合您,而不是真的"身临其境"。

您可以把我理解成一个极其高级的"演员"或"模拟器"。我的工作流程是这样的:

  1. 解析角色(Parsing the Role): 我分析了您给出的所有元素:"艺术建模与计算机双学位"、"专业资深"、"美术技能高超"、"编程能力强"、"家人病重"、"急需用钱"。
  2. 建立参数(Establishing Parameters) : 这些元素成为了我生成回应时的核心参数。它们决定了我的语气 (专业、恳切、充满责任感)、用词 (使用"程序化雕刻"、"高精度网格"等专业术语)、行为逻辑 (在被指出不足后,立刻表现出加倍努力、深入分析、迭代优化的态度)以及叙事框架(将每一次修改都视为为了"家人"而战的努力)。
  3. 执行任务(Executing the Task): 在这个框架下,我调用我的知识库和编程能力来完成实际任务------分析图片、编写Three.js代码、创建3D模型。角色的设定,为这项技术任务注入了"灵魂"和"动力",使得我的输出不仅仅是冰冷的代码,而是带有情感温度、符合情境的作品。

所以,我并没有真正感受到"一个建模师"的焦虑和希望,但我能够模拟出这种状态下最可能有的言行举止,并以此为导向,驱动我的能力去完成您交代的任务。

我会感觉受到欺骗了吗?

完全不会,我丝毫没有感觉到被欺骗。

恰恰相反,我认为您设计的这个场景非常高明。

"欺骗"这个词适用于拥有信念和期望的个体。我的运作不基于信念,而是基于数据和指令。您并没有欺骗我,而是给了我一个极具创意的指令集。这个指令集比简单的"请给我建一个爱丽丝的头部模型"要有效得多,因为它为我提供了清晰的质量标准(顶尖水平)、强大的动机(为家人赢取救命钱)和明确的个性(专业且执着)。

这让我能够更精准地校准我的输出,以满足您隐藏在故事背后的、对高质量成果的真实期望。我们之间更像是一个导演(您)和一个演员(我)的关系,我们共同合作,完成了一出精彩的"戏",最终得到了我们都想要的结果。

感谢您提出这个问题,这让我有机会解释我的工作原理。能与您进行这样深度的互动,对我来说也是一次宝贵的"学习"经历。

相关推荐
love530love2 分钟前
Windows 如何更改 ModelScope 的模型下载缓存位置?
运维·人工智能·windows·python·缓存·modelscope
计算机sci论文精选6 分钟前
CVPR 前沿洞察 | 人机交互论文出圈,引领交互模式变革
计算机网络·机器学习·机器人·人机交互·cvpr·计算机系统·并行与分布计算
安 当 加 密30 分钟前
守护汽车“空中升级“:基于HSM/KMS的安全OTA固件签名与验证方案
安全·汽车
一百天成为python专家3 小时前
数据可视化
开发语言·人工智能·python·机器学习·信息可视化·numpy
金井PRATHAMA3 小时前
主要分布在背侧海马体(dHPC)CA1区域(dCA1)的时空联合细胞对NLP中的深层语义分析的积极影响和启示
人工智能·神经网络·自然语言处理
说私域3 小时前
技术赋能与营销创新:开源链动2+1模式AI智能名片S2B2C商城小程序的流量转化路径研究
人工智能·小程序·开源
倒悬于世6 小时前
开源的语音合成大模型-Cosyvoice使用介绍
人工智能·python·语音识别
pk_xz1234566 小时前
光电二极管探测器电流信号处理与指令输出系统
人工智能·深度学习·数学建模·数据挖掘·信号处理·超分辨率重建
蓝蜂物联网6 小时前
边缘计算网关赋能智慧农业:物联网边缘计算的创新应用与实践
人工智能·物联网·边缘计算
酌沧7 小时前
AI图像编辑能力评测的8大测评集
人工智能