OpenAI CEO透露GPT-4表现“有点糟糕”；通义听悟音视频问答登场；Adobe整合AI功能助力3D设计创作

🦉 AI新闻

🚀 OpenAI CEO透露GPT-4表现"有点糟糕"

摘要：OpenAI的首席执行官Sam Altman在与Lex Fridman的访谈中表示，GPT-4的表现并不令人满意，认为其"有点糟糕"，同时对即将到来的GPT-5寄予厚望。Altman指出，尽管GPT-4在某些方面存在亮点，但其在处理复杂多步骤问题上几乎无用，最佳应用于头脑风暴。此外，他还提到今年将会推出新模型，不是GPT-5，但具体细节尚未透露。尽其所言，GPT-4的不足并未阻碍OpenAI达到每周1亿用户和800亿美元的高估值。

🚀 阿里"通义听悟"发布新功能，音视频问答登场

摘要：阿里大模型产品"通义听悟"近日升级，新增六项功能，包括音视频问答助手"小悟"、一键AI改写、思维导图生成等。小悟可对长达6小时、6G大小的音视频文件进行内容问答，支持多语言自由问答，并能智能推荐问题。其它新功能还有口语转书面文案、自动生成思维导图，适用于广泛场景如采访整理、播客摘要等。同时，面向中国大陆高校师生推出高校公益计划，提供额外资源支持。自去年6月公测以来，"通义听悟"已拥有上百万用户，成为学习、工作中的有力工具。

🚀 谷歌发布VLOGGER AI：实现肖像动态朗读

摘要：谷歌近日推出了VLOGGER AI模型，这是一款能够将静态肖像和音频内容结合，生成动态视频的多模态Diffusion模型。VLOGGER AI通过训练MENTOR数据库，该数据库含有80万名人物肖像和2200小时视频，可生成不同种族、年龄、外观的肖像视频。该技术不需针对每个人单独训练，能够生成包含不同场景的完整图像，有望应用于报告、教育和旁白等领域，将影视制作中的表情调整做到极致。此次开发被视为向"通用聊天机器人"迈进的关键一步。

🚀 Adobe整合AI功能助力3D设计创作

摘要：Adobe公司最近宣布，其旗下Substance 3D Sampler与Stager应用将整合Firefly生成式人工智能（AI）功能，旨在帮助工业设计师、游戏开发人员和视觉特效专家高效完成3D设计工作。Substance 3D Stager基于Adobe Dimension重构，方便在3D场景中构建模型和环境，并生成高质量虚拟照片。而Substance 3D Sampler，则让材质创建变得简单迅速。此次更新加入了文本到纹理和生成背景两大AI功能，通过自然语言的输入即可生成逼真或风格化的纹理以及详细的背景图片，极大提升了创作的自由度和效率。

🚀 Stability AI发布全新3D生成模型SV3D

摘要：Stability AI最近推出了一个新的技术进展------稳定视频3D（SV3D），基于先前的稳定视频扩散（SVD）模型，SV3D能够仅使用一张图片生成高质量的3D网格。该技术旨在通过视频模型的时间一致性来提高3D生成的一致性和质量，同时引入了多项创新，包括掩码得分蒸馏采样、基于球面高斯的照明模型，并且通过优化网络架构，提升了处理图像的能力。此技术经过验证，在新视角合成（NVS）和3D重建方面达到了最先进的水平（SOTA），预示着未来可能被广泛应用于游戏和视频项目。重要的是，这一项目模型权重将开源，仅限非商业用途。

🚀 网民冒充警方账号发布虚假信息被拘留

摘要：一名网民许某为吸引粉丝和引流，注册了"反诈小能手"的ID，并假冒"长沙市派出所天心分局"的公安公众账号，以博取平台关注。该网民在其账号个人简介处冒用"湖南省长沙市天心区天心分局坡子街"地址，发布含有假警官证、警服、手铐等敏感要素的视频。他还利用AI技术生成带有警徽的虚假《悬赏通告》，声称"长沙天心区发生重大刑事案件"，并提供虚构的嫌疑人信息及民警联系方式。许某被公安机关依法调查后，如实陈述其行为，并被处以行政拘留三日的处罚。

🗼 AI知识

🔥 TacticAI足球战术分析中的人工智能助手

TacticAI是一个基于足球角球数据的人工智能助手，能够准确预测角球的接球球员和射门可能性，以及生成调整球员位置和速度的战术建议。

通过对合理的战术变化进行生成，TacticAI可以在角球分析中提供有用的战术建议，并且这些建议被专业人员认可，并且能改善角球局势。

TacticAI利用几何深度学习来产生球员的表示，以及从相似的角球情景中进行挖掘，这使得教练能够分析以往成功的战术和反战术，并且为未来的战术决策提供指导。

🔥 文本到图像扩散模型进行可控生成的资源集合

文本到图像扩散模型可控生成相关文献资源列表

更多AI工具，参考国内AiBard123，Github-AiBard123