AI复活亲人市场分析:技术、成本与伦理挑战

"起死回生"这种事,过去只存在于科幻电影里,但今年,被"复活"的案例却越来越多。

2月底,知名音乐人包晓柏利用AI"复活"了她的女儿,让她在妈妈生日时唱了一首生日歌;3月初,商汤科技的年会上,刚刚去世不久的创始人汤晓鸥以数字人的形式被"复活",并进行了风格独特的演讲;近日,有网友用AI技术"复活"了李玟、乔任梁等已逝明星,掀起了巨大的争议。

与逝去的亲人"再见面"这门原本隐秘小众的生意,开始频繁出现在公众视野中。但由于所用技术不同,价格和效果也各不相同。

花10元,可以让去世亲人的照片"眨眼",背后是简单的图像处理技术;花费千元,可以通过AI换脸变声技术与未能告别的亲人视频通话;花费万元,能够与屏幕中亲人的克隆数字人进行聊天,这种数字人能够说话、行动和表现表情,真实感更强。

"AI复活"是一门有强烈需求的生意,潜藏着数亿级市场,然而涉足这一领域的商家鱼龙混杂。有的下载软件就能制作"会说话的照片"进行售卖;有的数字人服务商在向企业售卖直播、会展、主持人等数字人服务之外,开发了面向个人的数字人定制APP;还有一些商家,通过自研+接入第三方技术接口的方式,为用户提供定制化服务。

未来,"AI复活"或许会像拍照一样普遍,但其中也存在数据隐私和法律伦理等问题。有业内人士警告称,AI换脸变声技术的成熟可能被一些人利用,以用户对亲人的思念和信任实施诈骗,因此他提醒大家"回忆虽好,谨防被'割'"。

"复活"亲人,需要多少钱?

目前市面上的"AI复活"产品,根据成本和技术难度分为三个等级,对应着用户在"复活"亲人后与之"再见"的三种方式。

最低档次是照片驱动,即俗称的talking photo(会动的照片)。前几年就有类似的APP火了一阵子。利用深度学习和图像处理等技术,可以让照片中的人物嘴巴和眼睛动起来;若要让照片中的人开口说话或唱歌,则需用到唇语匹配和语音生成技术。这些技术已经成熟且开源,量产后单次成本可以压缩到10元以内。据有10年AI创业经验的极链科技创始人&总裁董慧智介绍。

第二档次是表情捕捉驱动的伪直播,通过将真人模特替换成逝者的形象和声音,实现语音电话或视频通话互动,或者生成祝福短视频等。这里涉及语音克隆、AI换脸、动捕(表情捕捉)、深度伪造(deepfake)等技术。这种方式特别讨巧,技术并不新鲜,部分AI诈骗也采用类似技术。动捕设备及人力成本较高,需要数千元。这类"AI复活"的视频片段在短视频平台播放量很高,通常是小辈为家中老人下订单,使用逝者的脸和声音与老人通话,称逝者在外工作,延续"善意的谎言"。老人往往看不出破绽,只是频频抹泪。

第三档次是近期火热的用数字人技术"复活"亲人。由于产品不同,成本也有所不同。通常通过收集人物生前的照片、声音等数据来克隆数字人的形象和声音,然后底层搭载大语言模型模拟逝者的思想,能与之进行实时的文字或语音交流。51数字人公司提供这项业务,创始人陈鸿介绍,一般产品交付的是一个带有数字人的屏幕,大屏如电视,小屏如iPad。用户登录账号后,可以看到逝去亲人的数字人形象,能够通过语音或文字与之互动,产品还提供语音电话叫醒服务。"定制类的'复活亲人'业务,一般要5万元以上。"陈鸿称,客户大多是长期付费,后续不断在细节上调优,也有家族凑钱一起做的,要求更高。

"AI复活"对数据质量要求极高,被克隆者生前的照片、视频或语音样本越多、越清晰,数字人的相似度就越高。再输入一些个人特征数据,如兴趣爱好,才能模拟其性格。"素材不全,成本会增加。"陈鸿表示。因此,精度越高、数据越定制化,效果也越接近真人,价格也更昂贵。所谓的精度,主要体现在人物口型准确度、分辨率清晰度、动作复杂程度、服饰发型和表情丰富度、语音(音色、语气)相似度、是否有电音、是否有抑扬顿挫(多情感)、是否带交互、交互是否更贴合本人性格等。

在数字人领域,要完美克隆某个人的技术难度"上不封顶"。商汤科技"复活"创始人汤晓鸥就是一个例子。商汤科技数字空间事业群数字文娱事业部总经理栾青告诉「定焦」,为了还原汤老师的音容笑貌,采用了不同技术。整个制作过程中,商汤运用了自研的TTS语音生成大模型,截取了汤老师四、五段不同说话风格的声音作为prompt(提示),总声音素材不过十几秒,还原了汤老师的东北口音、音色、常用的语气词和语调以及冷幽默的风格。此外,商汤如影数字人技术团队使用汤老师之前清晰有效的视频,通过商汤自研的视频生成技术进行动作生成和场景过渡,还原走动、喝水等动作,以及微笑的表情。

受限于素材不多,以及算力和成本的考虑,目前很多数字人的视频和产品看起来仍然很"假"。"这些都不算是完整的'复活'数字人,技术和服务的最高交付上限,无法满足人们的最低需求下限。"陈鸿称。形象不够像,只能用情绪价值来补充,在数字人的设计上加入一些交互细节。他举例说,比如一个客户的爷爷最喜欢老四,聊天时爷爷会突然提到下个月是老四的生日,家人要多聚、兄弟要和睦,客户就会被打动。

总的来说,前两档使用相对简单的图像处理、换脸和声音克隆技术,可以看到人脸、模仿声音,但由于成本低,效果粗糙。市面上见到的还原度较高且能动、能对话的,属于第三档数字人,越像越贵。

谁在靠克隆人赚钱?

从过往的"复活亲人"案例来看,大部分不像真人且让人出戏甚至尴尬。而随着生成式AI技术的发展,栾青观察到,"AI复活"在技术上的可行性和真实度上都大幅提高,能让人投入、感动,从而激发更多需求。

由此,一条产业链应运而生。这条产业链上,有跟风商家、数字人服务商、AI从业者,还有专门做定制AI复活(复活或克隆亲人、明星、企业家等)的玩家。电商平台上,不少店铺提供"AI复活"服务,标价多为10元、50元。短视频平台上,也有不少人以"AI造梦""AI疗愈"为名提供类似服务。"收费便宜、效果粗糙,但这是一个长期存在的长尾市场。"董慧智称。

淘宝上售卖的"让照片说话"服务图

这类生意也存在灰色空间。有短视频博主发布"复活"李玟、张国荣、乔任梁等已逝名人的视频,让他们开口唱歌和说话,虽然声称"旨在致敬和纪念,无商业目的",但此类视频流量颇高,还有部分借此引流做"亲人复活"生意。同时,一些提供"AI复活"服务的店铺也注明"只做怀念,人脸识别请绕道"。

目前,技术成熟的数字人服务商和AI从业者,更多是将商业模式放在B端,如AI客服、数字人直播、AI老师、AI主持人、AI医疗等,有部分推出了面向C端的类似工具,但并未大规模宣传。网友曾用大模型初创公司MiniMax

推出的FacePlay产品,让数字人"复活"费玉清;公司推出了一款可多人实时互动的AI视频通话产品"心心",曾吸引不少普通人用其来"复活"亲人,但公司尚未开展相关业务。MiniMax联合创始人杨斌称,"此类技术没有问题,关键在于应用是否妥当。"

多家数字人服务商告诉「定焦」,他们在收到B端客户需求时,不少是用于"克隆"特定人物,尤其是短视频平台上的虚拟主播,很多是参考现有红人进行数字人定制。此外,也有一些"复活"逝者的需求,但公司较为谨慎,通常用行业案例视频来回应需求。

由于"复活亲人"涉及数据隐私、法律伦理等问题,技术服务商在与客户对接时也较为小心。栾青称,商汤目前没有向C端推出"复活亲人"服务,"我们要尊重原始数据保护的法律和伦理边界。"目前,商汤的数字人应用主要还是基于角色扮演(IP)、主播、老师等场景,这些数字人没有特定的人格,只提供情绪、内容和情感。

更多公司选择与第三方公司合作提供服务。大模型和生成式AI公司出门问问联合创始人李志飞称,他们曾与殡葬企业永安堂合作推出"定制AI助手",用AI与传统殡葬行业结合的模式,"复活"亲人。此外,51数字人也在与相关企业合作探索更多可能性。

也有一些创业公司直接涉足C端业务,研发相关技术并提供"复活亲人"的定制化服务。陈鸿介绍,51数字人曾有一些客户,是找亲朋好友凑钱一起下单,将逝者的形象和声音传到大屏上,然后装在家中某个位置,配合逝者的服装、发型、妆容等,提升家族仪式感,也给后辈一种情感寄托。"但这类服务依然小众。"

在更多从业者看来,数字人虽能做到越来越像,但仍无法取代真人。MiniMax的杨斌称,"即使科技再发达,人类依然是特殊的存在。" 在他看来,数字人只是一种工具,不能也不该有太高期待。

争议与风险:情感操纵?

越来越多的逝者被数字人技术"复活",带来的不仅是情感的释放,也有技术滥用的风险。资深AI行业观察者陆嘉瑞告诉「定焦」,从实际使用效果看,用户对"复活亲人"的需求多是想要释放情感,但AI生成的音视频并不代表本人行为,"这是一种情感欺骗。"他称,当一个人面对"复活亲人"时的反应,并不是真实互动,这与"换头"短视频所带来的情感冲击不同,更可能引发不良影响。

同样,商汤科技的栾青也持保留意见。在她看来,虚拟人技术带来的是情感投射和共鸣,而数字人的使用应该有伦理边界,不能随意用技术操控情感。

另一个隐患是数据隐私和安全。去年,某明星就因私人照片被不法分子利用AI换脸技术制作不雅视频,产生恶劣影响。陆嘉瑞称,尽管AI生成的音视频并非真人,但其细节、情感表达等可能被利用,尤其是AI换脸变声技术成熟后,可能被一些人利用,以用户对亲人的思念和信任实施诈骗。

51数字人的陈鸿也警告称,用户在输入数据时应小心,尤其是语音数据,防止被不法分子获取并利用。他建议,"不要轻易分享个人数据,使用AI服务时要认准正规平台,避免数据泄露。"

此外,法律和伦理问题也是"AI复活"领域的难题。目前,国内尚无专门针对AI换脸和复活技术的法律法规。陆嘉瑞建议,相关部门应尽快制定法律法规,规范数字人技术的使用,避免技术滥用带来不良后果。

2015年,俄罗斯亿万富翁德米特里·伊茨科夫发出倡议,宣称到2045年将为所有人打造一副机器人身体来实现永生,这项计划面临一定争议。2022年,伊隆·马斯克在推特上提到已经将自己的大脑上传到云端,并与自己的虚拟版本交谈过,但有人认为这是马斯克在宣传自己的脑机接口公司Neuralink。

随着"AI复活"褪去神秘感,行业或许也会开始进入价格内卷的时代,如果不想出现"劣币驱逐良币"的情况,行业还需保持敬畏之心。

相关推荐
天下琴川几秒前
Dify智能体平台源码二次开发笔记(6) - 优化知识库pdf文档的识别
人工智能·笔记·pdf
HenrySmale38 分钟前
信息科技伦理与道德0:课程安排
人工智能·科技·计算机视觉
yngsqq1 小时前
CAD 像素点显示图片——CAD二次开发 OpenCV实现
人工智能·opencv·计算机视觉
Luke Ewin1 小时前
一个基于OpenAI Whisper开发的音视频字幕文件生成工具
人工智能·whisper·音视频·语音识别·asr·语音转写·视频字幕生成
老马啸西风2 小时前
AgentGPT 在浏览器中组装、配置和部署自主 AI 代理 入门介绍
人工智能·ai·openai·agent·robot·deepseek·mcp
京东零售技术2 小时前
京东3D空间视频生成技术探索与应用
人工智能
Jamence2 小时前
多模态大语言模型arxiv论文略读(十六)
人工智能·语言模型·自然语言处理
武汉唯众智创2 小时前
人工智能(机器人)通识实验室解决方案
人工智能·机器人·人工智能实验室·人工智能通识实验室·人工智能通识·机器人通识实验室·机器人实验室
巷9552 小时前
深入理解卷积神经网络(CNN):从原理到实践
人工智能·神经网络·cnn