谷歌宣布将 Gemini 项目团队纳入 DeepMind,以优化组织结构和加强技术协同。此次整合将提升 AI 技术的研究和应用,推动多模态 AI 模型的发展。Gemini 以其在处理文本、图像、音频和视频等多数据类型的能力而闻名,与 DeepMind 的结合将加速新模型的研发,提高市场响应速度。同时,这一举措也有助于谷歌在激烈的 AI 领域竞争中保持领先。
4.Viggle AI 再推新功能,可通过录制声音让角色说话
Viggle AI 推出新功能,用户可以通过录制声音让角色说话并实现口型同步。这项创新技术让用户完全控制角色的表现方式,无论是唱歌还是跳舞,都能轻松实现。Viggle 利用先进的 JST-1 视频 3D 基础模型,用户可以轻松创造和混合视频内容。
5.Adobe 发布 Project Turntable:2D 图像旋转与自动补全工具
Adobe 在 MAX 2024 大会上发布了 Project Turntable,一款能将 2D 矢量图像旋转并自动补全缺失部分的 AI 工具。它通过 AI 技术,让设计师轻松旋转图像至任意角度,同时自动生成不可见部分,实现 3D 视觉效果。用户只需简单操作,即可查看不同视角,极大提升工作效率。目前该工具处于开发初期,未来有望成为设计软件的标准功能。