近期AI大事件跟踪

欢迎来到【FunnyAI】本栏目探索人工智能世界的最新指南，定期为大家呈现AI领域的热点内容，AI产品应用，最新AI工具，AI算法解析。

百度Create AI开发者大会4个重要信息

4月16日，百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上发表"人人都是开发者"的主题演讲，他指出，"AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。

【主要亮点】

⭐️ 百度正式发布文心大模型4.0工具版，代码生成、解释和优化已达国际先进水平。

⭐️ 百度发布智能计算操作系统万源支持77款大模型。

⭐️ 百度推出AgentBuilder、AppBuilder、ModelBuilder三大开发工具，降低开发技术门槛。

⭐️百度文心一言用户数突破2亿，API 日均调用量2亿

在线回顾地址：https://create.baidu.com/?lng=zh

GPT-4Turbo 击败 Claude3，重新夺回 "最佳AI模型" 称号

OpenAI的最新更新使GPT-4Turbo在Chatbot Arena中超越了82个LLM模型，展现出色，重新夺回榜首位置。用户可以在Chatbot Arena中比较不同模型的表现。

【主要亮点】

⭐️ GPT-4Turbo在Chatbot Arena中超越82个LLM模型。

⭐️ 根据用户可比较模型回答，GPT-4Turbo表现出色。

⭐️ 访问Chatbot Arena网站进行比较与测试。

李飞飞团队揭底大模型训练成本：：Gemini Ultra是GPT-4的2.5倍

斯坦福 HAI 研究所增加了有关负责任人工智能的扩展章节，有关科学和医学领域人工智能的新章节，以及对研发、技术性能、经济、教育、政策和治理、多样性和公众舆论的综述。

【主要亮点】

⭐ 2023年的进展速度比以往快得多，GPT-4、Gemini 和 Claude3等最先进的系统显示出令人印象深刻的多模态功能

⭐ 2023年新发布的支持生成式 AI 的大型语言模型数量比前一年翻了一番，2/3开源模型，例如 Meta 的 Llama2，但性能最佳的是闭源模型

⭐ 工业界继续主导人工智能前沿研究。工业界产生了51个值得关注的机器学习模型，而学术界仅贡献了15个

⭐ 2023年，61个著名的人工智能模型源自美国机构，远远超过欧盟的21个和中国的15个。

⭐ Gemini Ultra 是第一个在大规模多任务语言理解关键基准测试中达到人类水平表现的 LLM。

⭐ 前沿人工智能模型的开发成本正变得越来越高。据说 Gemini Ultra 消耗了价值1.91亿美元的计算资源，而 GPT-4的开发成本估计为7800万美元。

AI指数地址：https://hai.stanford.edu/news/ai-index-state-ai-13-charts![在这里插入图片描述](https://file.jishuzhan.net/article/1781095967345348609/f90f63d311dde9b4558441c063465bda.webp)

PR重大更新!Sora加入 $Adobe$ 全家桶视频剪辑加入AI魔法

Adobe Premiere Pro是一款功能强大的视频编辑软件，集成了AI技术，旨在简化复杂的编辑任务并加速编辑流程。软件提供了文本基础编辑、音频分类标签、语音转文字、增强语音、场景检测、自动色彩调整、形态变换、颜色匹配、音频自动调节、自动重构等功能，大大提高了编辑效率和创作可能性。Premiere Pro适用于社交媒体短视频制作到长片电影的编辑，帮助用户节省时间，专注于创意和故事讲述。

【主要亮点】

⭐️ Adobe Premiere Pro正在引入AI工具，简化视频编辑流程，提高编辑效率。

⭐️ 目前已推出自动生成文字稿、AI音频分类标签、语音转文本、增强语音、自动切割场景、自动调色等功能。

⭐️ 将引入第三方AI模型，包括Sora、Runway、Pika等AI视频模型，允许用户点击拖动来延长视频

⭐️ 用户可以使用AI工具对视频进行对象移除、添加、扩展视频、转录视频等

产品体验地址：https://www.adobe.com/products/premiere/ai-video

Ctrl-Adapter:专为视频生成设计的Controlnet 提供有效精细控制

Ctrl-Adapter是一个专门为视频生成设计的Controlnet，提供图像和视频的精细控制功能，优化视频时间对齐，适配多种基础模型，具备视频编辑能力，显著提升视频生成效率和质量。

【主要亮点】

⭐丰富控制功能: 为图像和视频模型提供多种控制选项。

⭐稀疏帧视频支持: 有效处理低帧率视频，提供有效控制。

⭐适配多种基础模型: 支持多条件控制生成过程，提高生成效率。

项目地址：https://ctrl-adapter.github.io/

Quora 旗下 Poe 推出多机器人聊天功能

Poe 推出多机器人聊天功能，致力成为对话 AI 应用商店，提供变现工具和企业服务。面临挑战与不确定性，如聊天机器人体验差异性、质量控制、成本压力等。Poe 是一个 AI 聊天工具，让您可以提问并获得即时回答，还可以进行双向对话。它提供了 GPT-4、gpt-3.5-turbo、Anthropic 的 Claude 等各种不同的机器人。

【主要亮点】

⭐️ Poe 推出多机器人聊天功能，将用户与多个 AI 模型整合在一个对话中。

⭐️ Poe 计划成为对话 AI 应用商店，为创作者提供变现工具和企业服务。

⭐️ 挑战与不确定性: 聊天机器人体验差异性、质量控制、成本压力等问题需面对。

产品入口：https://poe.com/

图像转文字工具2txt：可识别图像中文字并转换为可编辑文本

【主要亮点】

⭐2txt基于AI，可识别图像文字并转为可编辑文本

⭐ 使用Claude Haiku和Vercel AI SDK创建，准确快速

⭐ Next.js框架提供高效网页渲染，用户上传图片即可获取文本结果

体验地址：https://2txt.vercel.app/

开源地址：https://github.com/ai-ng/2txt

EleutherAI发布最新模型Pile-T5解决代码处理相关任务局限性

Pile-T5是EleutherAI推出的一款自然语言处理模型，它在原有的T5模型基础上，采用了Pile数据集和LLAMA分词器进行训练，以改善对代码任务的理解能力。该模型经过了2万亿个token的训练，是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色，尤其是在代码相关任务上。此外，EleutherAI还提供了中间检查点，以便研究人员研究模型随时间的演变。

【主要亮点】

⭐ Pile-T5训练量是原始T5的两倍，达到200万步，学习到更丰富语言模式和代码结构。

⭐ Pile-T5采用新LLAMA分词器，更准确处理代码相关任务。

⭐ Pile-T5在微调下游任务表现显著改进，尤其在代码任务上，性能优于T5-v1.1。

官方网址：https://blog.eleuther.ai/pile-t5/

新版对抗AI抓取工具Glaze2发布，保护艺术家作品免受未经授权的AI抓取

Glaze是一个旨在保护人类艺术家免受AI风格模仿的系统。通过机器学习算法对艺术作品进行微小改动，使其对人类眼睛看起来不变，但对AI模型则呈现出完全不同的艺术风格。这样，当有人试图模仿特定艺术家的风格时，AI生成的结果将与预期大相径庭。Glaze不是永久解决方案，但是一个必要的第一步，为艺术家提供抵抗AI模仿的工具。

【主要亮点】

⭐ 新版Glaze2工具发布，帮助艺术家保护作品免受AI模型抓取。

⭐提供更快速、更强保护，特别针对新AI模型如Stable Diffusion XL。

⭐计划扩展保护范围至短视频和动画领域。

官网地址：https://glaze.cs.uchicago.edu/

蚂蚁数科正式发布ZOLOZ Deeper防范"AI换脸"风险

Deepfake（深度伪造）已成为一种新型的网络犯罪手段，给数字世界的安全带来了严峻挑战。为此，蚂蚁数科旗下生物识别品牌ZOLOZ近日正式发布了针对Deepfake的综合防控产品ZOLOZ Deeper。

【主要亮点】

⭐ 前端通过精密的传感器校验与多维特征动态风控，对摄像头状态、设备环境等进行全面检测。

⭐对面部动态进行细致分析，捕捉微表情、肌肉纹理等细微特征。

⭐通过GAN模型生成超3万测试样本，不断丰富ZOLOZ Deeper的识别能力。

近期AI大事件跟踪

百度Create AI开发者大会4个重要信息

GPT-4Turbo 击败 Claude3，重新夺回 "最佳AI模型" 称号

李飞飞团队揭底大模型训练成本：：Gemini Ultra是GPT-4的2.5倍

PR重大更新!Sora加入Adobe全家桶 视频剪辑加入AI魔法

Ctrl-Adapter:专为视频生成设计的Controlnet 提供有效精细控制

Quora 旗下 Poe 推出多机器人聊天功能

图像转文字工具2txt：可识别图像中文字并转换为可编辑文本

EleutherAI发布最新模型Pile-T5解决代码处理相关任务局限性

新版对抗AI抓取工具Glaze2发布，保护艺术家作品免受未经授权的AI抓取

蚂蚁数科正式发布ZOLOZ Deeper防范"AI换脸"风险

PR重大更新!Sora加入 $Adobe$ 全家桶视频剪辑加入AI魔法