OpenAI 重大人事变动,联创加入死敌;阿里视频框架 Tora 操控物体运动轨迹丨 RTE 开发者日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、阿里团队推出视频 AI 生成框架 Tora:画圈操控物体运动轨迹

阿里团队最新推出了 AI 视频生成框架 Tora,同时集成了文本、视觉和轨迹条件用于生成视频,是基于轨迹导向的扩散变换器(DiT)技术。

Tora 由一个轨迹提取器(TE)、一个时空 DiT 和一个运动引导融合器(MGF)组成:

TE 使用 3D 视频压缩网络将任意轨迹编码为分层时空运动补丁。

MGF 将运动贴片集成到 DiT 模块中,以生成遵循轨迹的连贯视频。

Tora 无缝契合 DiT 设计,支持制作最长 204 帧、720P 分辨率的视频,可以精确控制不同持续时间、宽高比和分辨率的视频内容。大量实验证明,Tora 在实现高运动保真度方面表现出色,同时还能细致模拟物理世界的运动。

其独特设计理念融合文本、视觉和轨迹条件,精准控制视频内容,模拟物理世界运动规律,为电影特效制作、虚拟现实领域带来无限可能。(@IT 之家)

2、OpenAI 正在研发 ChatGPT 文本水印

据《华尔街日报》报道,OpenAI 已经开发了一种工具,可以用来检测用户是否使用 ChatGPT 撰写文章。报道指出,这项检测技术实际上使用到了一种文本水印。用户无法通过肉眼察觉,但可以借助 OpenAI 的检测工具来进行识别。

在《华尔街日报》的这篇报道发出后,OpenAI 还更新了 5 月份的一篇博客文章,更新内容主要为检测 AI 生成内容进行的研究。更新内容中指出,文本水印已被证明「非常准确,甚至对局部篡改也有效」。不过在检测全局篡改方面的能力较弱,比如使用翻译系统,用另一个生成模型改写,或者要求模型在每个单词之间插入一个特殊字符,然后删除该字符等操作。(@爱范儿)

3、OpenAI 又动荡,Greg Brockman 长期休假,另一联创加入死敌

OpenAI 经历重大人事变动,联合创始人 Greg Brockman 长期休假,John Schulman 转投竞争对手 Anthropic,产品负责人 Peter Deng 离职。Brockman 对 AI 模型和产品如 ChatGPT 转化有关键贡献,Schulman 负责改进大型语言模型和领导安全团队。

变动发生在公司业务发展强劲但面临潜在重大损失的时期。联合创始人 Ilya Sutskever 和 Andrej Karpathy 分别离职创办新公司。OpenAI 可能从非营利组织转变为利益公司,正在训练下一代旗舰 AI 模型,推出搜索引擎,开发 AI 代理自动执行计算机任务。Schulman 跳槽希望更深入从事 AI 对齐工作。(@硅星人Pro)

4、Not Diamond:自动推荐最佳的 LLM,实时学习提升体验

智能聊天机器人 Not Diamond 不仅仅是一款聊天机器人,它能自动选择最佳的人工智能模型来应对您的每一个问题,并根据您的反馈不断学习和改进。

【自动 AI 模型路由】:Not Diamond 会根据您的消息内容自动选择最适合的人工智能模型。

【实时学习】:Not Diamond 会在您使用的过程中实时学习,以确保每次交互都能带来更好的体验。

【竞技模式】:开启竞技模式可以比较不同模型的表现,为您提供更加个性化的建议。

【API 访问】:Not Diamond 还提供了 API 接口,让您可以在自己的应用中集成自动 AI 模型路由功能。

(@AI 产品大观)

5、智谱 AI 「清影」视频模型开源

今天凌晨,THUKEG (智谱 AI 官方账号)在 Github 上将 CogVideoX 开源。值得注意的是,该模型为前两周很火的智谱的第二世代 AI 视频清影的基模型。

7 月 26 日,智谱 AI 曾在官方公众号发文,宣布清影大模型上线。该模型可以让用户通过几个字到几百个文字的表述,在等待 30 秒之后,就可以获得一段 1440 x 960 清晰度的高精度视频。(@爱范儿)

6、马斯克重启对 OpenAI 及其 CEO 的诉讼

据纽约时报报道,马斯克重新启动了针对 OpenAI 的诉讼,这一举措加剧了 OpenAI 的权利斗争。在周一向法院提交的新起诉书中指出,OpenAI 及其两位创始人 Sam Altman 和 Greg Brockman 将商业利益置于公共利益之上,违反了公司的创始合同。

诉讼书中还提到,在 2015 年与马斯克一起创建 OpenAI ,并承诺为人类的利益谨慎开发人工智能后,Sam Altman 和 Greg Brockman 放弃了这一使命,并与 Microsoft 建立了数十亿美元的合作伙伴关系。(@爱范儿)

02有态度的观点

1、周鸿祎:大模型成本还将进一步降低

昨日,周鸿祎在社交平台发布视频。他认为,大模型的成本还将进一步地降低,使得科技平权,可以真正普惠给每一个人和结构,真正实现大模型的工业革命。此外,他还谈及了自己预计的大模型四大发展:

  • 开源模型与闭源模型并驾齐驱

  • 多个专业模型的组合工作,其能力可以超过规模更大的大模型

  • 模型并不是越大越好,要把模型的成本降下来,才能让人们更广泛地接触 AI

  • 端侧大模型将持续发力

(@爱范儿)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
yusaisai大鱼3 分钟前
tensorflow_probability与tensorflow版本依赖关系
人工智能·python·tensorflow
18号房客3 分钟前
一个简单的深度学习模型例程,使用Keras(基于TensorFlow)构建一个卷积神经网络(CNN)来分类MNIST手写数字数据集。
人工智能·深度学习·机器学习·生成对抗网络·语言模型·自然语言处理·tensorflow
神秘的土鸡10 分钟前
神经网络图像隐写术:用AI隐藏信息的艺术
人工智能·深度学习·神经网络
数据分析能量站11 分钟前
神经网络-LeNet
人工智能·深度学习·神经网络·机器学习
Jaly_W20 分钟前
用于航空发动机故障诊断的深度分层排序网络
人工智能·深度学习·故障诊断·航空发动机
小嗷犬22 分钟前
【论文笔记】Cross-lingual few-shot sign language recognition
论文阅读·人工智能·多模态·少样本·手语翻译
夜幕龙29 分钟前
iDP3复现代码数据预处理全流程(二)——vis_dataset.py
人工智能·python·机器人
吃个糖糖1 小时前
36 Opencv SURF 关键点检测
人工智能·opencv·计算机视觉
AI慧聚堂1 小时前
自动化 + 人工智能:投标行业的未来是什么样的?
运维·人工智能·自动化
盛世隐者1 小时前
【pytorch】循环神经网络
人工智能·pytorch