开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@JLT,@鲍勃
01 有话题的新闻
1、快速生成矢量图形,Adobe Illustrator 和 Photoshop 迎来新 AI 功能
Adobe 公司昨日宣布,其旗下两款明星软件 Illustrator 和 Photoshop 将迎来一系列基于人工智能的新功能。这些新功能旨在加速日常创作流程,并赋予设计师更多创作控制权。
Illustrator 的更新亮点包括「生成式形状填充」功能,用户只需输入简单的文字提示,就能为形状填充上精美的矢量图形。系统甚至可以根据文档中其他元素自动生成填充内容,而且所有生成的图形都是可编辑的矢量图。
Illustrator 的另一个新功能是「模型」,能帮助设计师快速将插图应用到真实物体上,如服装或包装,系统会自动调整尺寸和透视角度。其他新功能还包括从矢量或图像中识别字体并轻松编辑替换,以及通过「文字转图案」快速创建可编辑背景。
Photoshop 方面,Adobe 推出了「选区画笔工具」和「调整画笔工具」来简化重复性任务,并对文字工具和上下文任务栏进行了改进。同时,Photoshop 也将集成最新版本的 Adobe Firefly,进一步增强 AI 生成内容的能力。(@IT 之家)
2、马斯克宣布开始在全球最大 AI 训练集群上训练,今年 12 月前训练出全球最强 AI
近日,埃隆·马斯克通过社交平台 X(前身为推特)宣布了一项重大进展:其麾下的 xAI 公司正携手位于美国田纳西州孟菲斯的「孟菲斯超级集群」,这一全球顶尖的 AI 训练设施,加速推进其 AI 技术的边界探索。
据当地权威媒体深入报道,孟菲斯超级集群的核心力量源自其配置的十万台采用液冷技术的 Nvidia H100 GPU,这些前沿芯片自去年面世以来便供不应求,连业界巨头 OpenAI 也竞相采用。
马斯克还透露,其目标是「在今年 12 月前训练出世界上最强大的人工智能(Grok3)」,而孟菲斯超级计算机集群正是其实现这一目标的优势所在。(@元力社)
3、Meta 新模型 Llama 3.1 正式发布
今天凌晨,Meta 发布了 Llama 3.1 模型。此次发布的 Llama 3.1 共有 8B、70B 和 405B 三个尺寸版本。
作为 Meta 迄今为止最强大的模型,它有着如下特点:
包含 8B、70B 和 405B 三个尺寸,最大上下文提升到了 128K,支持多语言,代码生成性能优秀,具有复杂的推理能力
从基准测试结果来看,Llama 3.1 超过了 GPT-4 0125,与 GPT-4o、Claude 3.5 互有胜负
提供开放/免费的模型权重和代码,许可证允许用户进行微调,将模型蒸馏到其他形式,并支持在任何地方部署
提供 Llama Stack API,便于集成使用,支持协调多个组件,包括调用外部工具
(@爱范儿)
4、Meta 推出 JASCO 音乐生成模型,通过和弦或节拍等条件输入来提高音乐生成可控性
Meta 在音乐生成领域推出 JASCO 音乐生成模型,这是一个文本到音乐的生成模型,它能够根据全局的文本描述以及细粒度的本地控制来生成音乐。JASCO 能够通过信息瓶颈层和时间模糊技术,提取与特定控制相关的信息,从而在同一个文本到音乐模型中同时整合符号性和基于音频的条件。模型特点是能够通过输入如和弦或节拍的条件信息来提高音乐生成的可控性。(@AI 科技评论)
5、AI 视频修复速度十倍提升,美图国科大新算法
美图影像研究院、中国科学院大学,以及四川大学的研究人员提出了一种新型 AI 视频修复算法 BlazeBVD。BlazeBVD,全称为 Blaze Blind Video Deflickering,是一种自动化的视频去闪技术。它能够在未知视频退化情况下,有效提升视频的时间一致性。这项技术的出现,为视频后期制作带来了革命性的改变。
该算法能够自动消除视频中的闪烁,并且处理速度比现有方法快 10 倍。BlazeBVD 无需预先知道视频闪烁的类型或程度,适用于各种视频。实验结果显示,BlazeBVD 在 PSNR 和 SSIM 指标上得分较高,且在 Ewarp 得分较低,表现出色的定性和定量结果,且比最先进的模型推理速度快 10 倍。相关论文已被 ECCV 2024 接收,并公开在 arXiv 上。(@AI 科技评论)
02 有态度的观点
1、麻省理工学院教授预测:未来十年,只有 1/4 的人工智能相关任务能够实现成本效益的自动化
麻省理工学院研究所教授 Daron Acemoglu 在高盛的播客中表示,未来十年,仅有 25% 的 AI 相关任务能够达到成本效益自动化的水平。Acemoglu 认为,即使 AI 取得了重大突破,其影响也需要时间才能体现。Acemoglu 对当前大型语言模型的架构表示怀疑,认为这些模型可能会遇到严重的限制,并且不确定通过增加 GPU 容量是否能够加速 AI 达到目标。他强调,未来需要更高质量的数据,但目前尚不清楚如何获得这类数据。
高盛全球股票研究主管 Jim Covello 指出,为了让投资在英伟达、微软、谷歌、Meta、亚马、超微电脑等公司的 AI 领域获得回报,AI 必须解决复杂问题。Covello 认为,目前 AI 解决的问题并不复杂,缺乏认知推理,人们对 AI 的作用存在误解。(@AI 科技评论)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻