奥特曼秀 5 颗草莓疯狂暗示 GPT-5？匿名新模型神秘现身，数学超强！｜AGI 掘金资讯 8.9

酱酱们中午好～今天的 AGI 掘金热点资讯来啦，我们知识库上线了 AI 小助手，欢迎来撩！

🌟 技术突破

🔗 亚马逊文生图 AI 模型 Titan Image Generator 升至 V2 版：可修改 / 编辑细节

亚马逊 AWS 推出了新一代 AI 图像生成模型 Titan Image Generator v2，该模型在初代基础上增加了图像调节、调色板控制、背景移除和主题一致性控制等新特性，提升了用户创作灵活性。利用 ControlNet 技术，用户可通过参考图像和文本提示精确控制图像生成，实现高度详细和结构化的创作，显著提高效率。尽管生成技术成本上升，亚马逊 CEO Andy Jassy 对 AI 技术在云端的发展前景表示信心。

🔗 AI 时代如何遏制优质内容被过度抓取？谷歌探索网络货币化模式

谷歌正在 Chrome 浏览器中开发网络货币化规范，以应对 AI 时代广告收入下降的问题。该方案允许用户通过小额支付直接向内容创作者支付，从而为站长和创作者提供新的营收途径。软件工程师亚历山大·苏尔科夫提出在 Chromium 源代码中引入网络货币化 API，实现无需用户交互的小额支付功能。用户可设置数字钱包，访问网站时自动进行支付，为内容创作者带来更直接的收入支持。

🔗 智驾闯入"无人区"，理想汽车郎咸朋：未来一年 10 亿美元只是入场券

理想汽车的智能驾驶研发副总裁郎咸朋透露，公司正在研发基于端到端模型的自动驾驶技术，该技术模拟人类思考和决策过程，由快系统和慢系统构成，分别负责实时控制和复杂逻辑思考。理想汽车的端到端模型是 One Model，与分段式模型不同，直接从传感器数据输出行驶轨迹。郎咸朋强调，高质量数据和充足算力是自动驾驶竞争的关键，理想汽车每年在训练上的投入预计需达 10 亿美元，以保持在智能驾驶领域的竞争力。

🔗 无比顺滑！告别 TTS！贾扬清领衔的 Lepton AI 推出实时语音交互

Lepton AI 由贾扬清领衔，推出了一项创新的实时语音交互技术，该技术通过将 LLM（大语言模型）和 TTS（文本转语音）合二为一，实现了文本和语音的并行处理，大幅减少了首次音频时间（TTFA），提升了对话流畅度。Lepton AI 的技术不仅减少了响应延迟，还引入了动态调整音频片段的高级机制，确保对话连贯自然。此外，该技术与多种开源 LLM 模型兼容，为开发者提供了广泛的应用可能性，预示着未来语音交互体验的大幅提升。

🔗 苹芯科技发布 PIMCHIP 系列 AI 芯片，推动存算一体技术

苹芯科技在北京举办的活动中推出了两款 AI 芯片 PIMCHIP-S300 和 PIMCHIP-N300。PIMCHIP-S300 是一款多模态智慧感知决策芯片，具有高能效、小面积、低功耗和低成本特点，搭载 SRAM 存算一体计算加速单元，能效比高达 27TOPS/W，支持音视频及多传感器接入。PIMCHIP-N300 是面向 AI 领域的专用加速核心，优化了神经网络模型处理，提供 0.5TOPS 单核算力，支持混合精度计算，兼容多种模型部署需求，针对特定应用场景进行了优化。两款芯片的推出旨在提升智能设备和 AI 大模型的计算效率，助力 AI 技术在多场景的应用落地。

🔗 统信发布中国首款操作系统级端侧模型 UOS LM，支持问答、翻译、创作等

统信软件技术有限公司推出中国首款操作系统级端侧模型 UOS LM，实现 AI 完全离线运行，强化数据安全。UOS LM 面向 AI PC 市场，提供个人和组织用户知识库搭建，开发者 AI SDK 接口，以及数据安全保障。该模型搭载本地向量数据库，支持问答、翻译、创作等功能，同时优化系统资源调度和硬件策略，打造硬件友好的操作系统。

💫 企业动态

🔗 OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放，但每天只能生成两张图片

OpenAI 宣布对 ChatGPT 的 DALL·E 3 图片生成功能进行重大更新，允许免费用户每天生成两张图片。这一更新标志着 AI 技术在图像生成领域的进一步普及和应用，为创意工作者和普通用户提供了更便捷的视觉表达工具。用户现在可以利用这一功能探索更多创意可能，同时享受 AI 带来的便利。

🔗 最强国产多模态刚刚易主！腾讯混元把 GPT-4/Claude-3.5/Gemini-1.5 都超了

腾讯混元 AI 大模型在 SuperCLUE-V 中文多模态测评基准中超越 GPT-4 等国际模型，成为国内闭源和开源领域的领先者。混元 AI 不仅在表情包理解、照片内容识别等测试中表现出色，还在实用场景如财报摘要分析、学术图表解读等方面展现了强大的多模态理解和生成能力。腾讯元宝 APP 集成了混元 AI，提供便捷的多端访问和聊天记录同步，进一步优化用户体验。

🔗 毒舌 AI 上线！全球 400 万网友破防，竟被这个 AI 骂哭了

推特上新推出的 AI"推特罗伯特"以其犀利的吐槽风格迅速走红，上线 11 天用户数突破 400 万。AI 通过分析用户推文，用幽默且尖锐的语言揭示个性特点，引发网友热烈讨论和自嘲。尽管有时言辞过于尖刻，但这种新型互动方式展示了 AI 在理解和模仿人类语言风格方面的潜力，同时也反映出人们对自我表达和社交互动的新需求。

🔗 阿里云推出首个域名 AI 大模型应用，上线".ai"域名后缀

阿里云在万网焕新发布会上宣布，其域名产品服务已通过 AI 技术升级，推出首个基于通义大模型的 AI 域名应用。用户可输入品牌和行业信息，系统将智能生成并筛选创意域名。新增 40 余个域名后缀，如".ai"，并提供 2000 万全球域名资源。同时，推出了域名查询、注册、管理的小程序端口，以及基于域名的"品牌扶持计划"，为企业提供优惠和安全服务。阿里云的这一升级，旨在为全球企业和创业者提供更智能、丰富、普惠的域名服务。

🔗 曝 OpenAI 领投 AI 硬件公司 Opal！B 轮融资 6000 万美元

AI 硬件公司 Opal 完成 6000 万美元 B 轮融资，由 OpenAI Startup Fund 牵头。Opal 原以生产网络摄像头为主，现有投资者 Founders Fund 和 Kindred Ventures 预计参与此轮融资。公司计划开发由 OpenAI 模型驱动的新设备，与 OpenAI 紧密合作，探索 AI 技术在办公设备等领域的应用，如创意激发器等。Opal 的转型和合作显示出 AI 技术在硬件领域的广阔应用前景。

🔗 苹果可能会对 Apple Intelligence 收费，月费最高可达 20 美元

苹果公司计划推出名为 Apple Intelligence 的人工智能系统，并可能对其高级功能收取最高 20 美元的月费，以推动服务业务增长。该系统将增强 Siri 并新增自动生成邮件和图像等功能。尽管初期部分地区无法获得，但苹果可能通过 Apple One 订阅模式收费。科技公司为 AI 服务收费已成常态，苹果此举或为整合服务提供新选项。

🔗 马斯克旗下社交媒体 X 因抓取用户数据训练 AI 在爱尔兰被起诉

爱尔兰数据保护委员会（DPC）已对马斯克的 X 平台提起诉讼，指控其未经用户同意擅自使用数据训练 AI 模型 Grok，违反了 GDPR 规定。DPC 已委托律师事务所提交诉讼，要求法院禁止或限制 X 平台使用个人数据开发人工智能系统，并计划将此案提交欧洲数据保护委员会审议。尽管 X 平台提供了用户退出机制，但 DPC 指出其仍收集了大量欧盟用户数据，诉讼旨在保护用户隐私权益。

🔗 上海发力 AI 教育：高校设备升级在即，人工智能研究迎新机遇！

上海市推出政策支持高校人工智能领域研究，强调设备更新以适应教学需求和安全标准。政策鼓励高校在算力平台、机器人等领域进行建设，特别关注集成电路、人工智能等战略和新兴领域，以提升研究能力和教学质量，推动 AI 赋能传统学科改造，促进科研发展。

🔗 下一个 SpaceX？Anduril 最新估值达 140 亿美元，微软也看中该市场

美国 AI 国防公司 Anduril，由 Oculus 创始人 Palmer Luckey 与 Palantir 早期成员共同创立，专注于国家安全和国防能力提升。公司近期完成 15 亿美元 F 轮融资，估值飙升至 140 亿美元。Anduril 计划扩建制造工厂，投资定制软件，并考虑海外建厂。受益于俄乌战争后美国对国防技术投资的增加，Anduril 已与美军方签订重要合同，包括 10 亿美元的反无人机技术合同。微软和 Palantir 也在争夺国防预算市场，合作整合云计算和 AI 工具，提供包括 GPT-4 在内的软件服务。

🎡 热门活动

🎡 AI Talk 沙龙 - 第2期｜2024.8.22 晚 19：30｜线上直播

🎁 AGI 掘金 x 飞书智能会议纪要 - 体验邀请

AGI 掘金成立于 2024 年7 月，是一家专注于 AGI 相关研究和应用的创新型知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展，并将其应用于各个行业，为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务，致力于成为行业的领军者。AGI 掘金期待你的加入！

欢迎戳我加入 AGI 掘金飞书社群交流学习😊