奥特曼秀 5 颗草莓疯狂暗示 GPT-5?匿名新模型神秘现身,数学超强!|AGI 掘金资讯 8.9

酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩

🌟 技术突破

🔗 亚马逊文生图 AI 模型 Titan Image Generator 升至 V2 版:可修改 / 编辑细节

亚马逊 AWS 推出了新一代 AI 图像生成模型 Titan Image Generator v2,该模型在初代基础上增加了图像调节、调色板控制、背景移除和主题一致性控制等新特性,提升了用户创作灵活性。利用 ControlNet 技术,用户可通过参考图像和文本提示精确控制图像生成,实现高度详细和结构化的创作,显著提高效率。尽管生成技术成本上升,亚马逊 CEO Andy Jassy 对 AI 技术在云端的发展前景表示信心。

🔗 AI 时代如何遏制优质内容被过度抓取?谷歌探索网络货币化模式

谷歌正在 Chrome 浏览器中开发网络货币化规范,以应对 AI 时代广告收入下降的问题。该方案允许用户通过小额支付直接向内容创作者支付,从而为站长和创作者提供新的营收途径。软件工程师亚历山大·苏尔科夫提出在 Chromium 源代码中引入网络货币化 API,实现无需用户交互的小额支付功能。用户可设置数字钱包,访问网站时自动进行支付,为内容创作者带来更直接的收入支持。

🔗 智驾闯入"无人区",理想汽车郎咸朋:未来一年 10 亿美元只是入场券

理想汽车的智能驾驶研发副总裁郎咸朋透露,公司正在研发基于端到端模型的自动驾驶技术,该技术模拟人类思考和决策过程,由快系统和慢系统构成,分别负责实时控制和复杂逻辑思考。理想汽车的端到端模型是 One Model,与分段式模型不同,直接从传感器数据输出行驶轨迹。郎咸朋强调,高质量数据和充足算力是自动驾驶竞争的关键,理想汽车每年在训练上的投入预计需达 10 亿美元,以保持在智能驾驶领域的竞争力。

🔗 无比顺滑!告别 TTS!贾扬清领衔的 Lepton AI 推出实时语音交互

Lepton AI 由贾扬清领衔,推出了一项创新的实时语音交互技术,该技术通过将 LLM(大语言模型)和 TTS(文本转语音)合二为一,实现了文本和语音的并行处理,大幅减少了首次音频时间(TTFA),提升了对话流畅度。Lepton AI 的技术不仅减少了响应延迟,还引入了动态调整音频片段的高级机制,确保对话连贯自然。此外,该技术与多种开源 LLM 模型兼容,为开发者提供了广泛的应用可能性,预示着未来语音交互体验的大幅提升。

🔗 苹芯科技发布 PIMCHIP 系列 AI 芯片,推动存算一体技术

苹芯科技在北京举办的活动中推出了两款 AI 芯片 PIMCHIP-S300 和 PIMCHIP-N300。PIMCHIP-S300 是一款多模态智慧感知决策芯片,具有高能效、小面积、低功耗和低成本特点,搭载 SRAM 存算一体计算加速单元,能效比高达 27TOPS/W,支持音视频及多传感器接入。PIMCHIP-N300 是面向 AI 领域的专用加速核心,优化了神经网络模型处理,提供 0.5TOPS 单核算力,支持混合精度计算,兼容多种模型部署需求,针对特定应用场景进行了优化。两款芯片的推出旨在提升智能设备和 AI 大模型的计算效率,助力 AI 技术在多场景的应用落地。

🔗 统信发布中国首款操作系统级端侧模型 UOS LM,支持问答、翻译、创作等

统信软件技术有限公司推出中国首款操作系统级端侧模型 UOS LM,实现 AI 完全离线运行,强化数据安全。UOS LM 面向 AI PC 市场,提供个人和组织用户知识库搭建,开发者 AI SDK 接口,以及数据安全保障。该模型搭载本地向量数据库,支持问答、翻译、创作等功能,同时优化系统资源调度和硬件策略,打造硬件友好的操作系统。

💫 企业动态

🔗 OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放,但每天只能生成两张图片

OpenAI 宣布对 ChatGPT 的 DALL·E 3 图片生成功能进行重大更新,允许免费用户每天生成两张图片。这一更新标志着 AI 技术在图像生成领域的进一步普及和应用,为创意工作者和普通用户提供了更便捷的视觉表达工具。用户现在可以利用这一功能探索更多创意可能,同时享受 AI 带来的便利。

🔗 最强国产多模态刚刚易主!腾讯混元把 GPT-4/Claude-3.5/Gemini-1.5 都超了

腾讯混元 AI 大模型在 SuperCLUE-V 中文多模态测评基准中超越 GPT-4 等国际模型,成为国内闭源和开源领域的领先者。混元 AI 不仅在表情包理解、照片内容识别等测试中表现出色,还在实用场景如财报摘要分析、学术图表解读等方面展现了强大的多模态理解和生成能力。腾讯元宝 APP 集成了混元 AI,提供便捷的多端访问和聊天记录同步,进一步优化用户体验。

🔗 毒舌 AI 上线!全球 400 万网友破防,竟被这个 AI 骂哭了

推特上新推出的 AI"推特罗伯特"以其犀利的吐槽风格迅速走红,上线 11 天用户数突破 400 万。AI 通过分析用户推文,用幽默且尖锐的语言揭示个性特点,引发网友热烈讨论和自嘲。尽管有时言辞过于尖刻,但这种新型互动方式展示了 AI 在理解和模仿人类语言风格方面的潜力,同时也反映出人们对自我表达和社交互动的新需求。

🔗 阿里云推出首个域名 AI 大模型应用,上线".ai"域名后缀

阿里云在万网焕新发布会上宣布,其域名产品服务已通过 AI 技术升级,推出首个基于通义大模型的 AI 域名应用。用户可输入品牌和行业信息,系统将智能生成并筛选创意域名。新增 40 余个域名后缀,如".ai",并提供 2000 万全球域名资源。同时,推出了域名查询、注册、管理的小程序端口,以及基于域名的"品牌扶持计划",为企业提供优惠和安全服务。阿里云的这一升级,旨在为全球企业和创业者提供更智能、丰富、普惠的域名服务。

🔗 曝 OpenAI 领投 AI 硬件公司 Opal!B 轮融资 6000 万美元

AI 硬件公司 Opal 完成 6000 万美元 B 轮融资,由 OpenAI Startup Fund 牵头。Opal 原以生产网络摄像头为主,现有投资者 Founders Fund 和 Kindred Ventures 预计参与此轮融资。公司计划开发由 OpenAI 模型驱动的新设备,与 OpenAI 紧密合作,探索 AI 技术在办公设备等领域的应用,如创意激发器等。Opal 的转型和合作显示出 AI 技术在硬件领域的广阔应用前景。

🔗 苹果可能会对 Apple Intelligence 收费,月费最高可达 20 美元

苹果公司计划推出名为 Apple Intelligence 的人工智能系统,并可能对其高级功能收取最高 20 美元的月费,以推动服务业务增长。该系统将增强 Siri 并新增自动生成邮件和图像等功能。尽管初期部分地区无法获得,但苹果可能通过 Apple One 订阅模式收费。科技公司为 AI 服务收费已成常态,苹果此举或为整合服务提供新选项。

🔗 马斯克旗下社交媒体 X 因抓取用户数据训练 AI 在爱尔兰被起诉

爱尔兰数据保护委员会(DPC)已对马斯克的 X 平台提起诉讼,指控其未经用户同意擅自使用数据训练 AI 模型 Grok,违反了 GDPR 规定。DPC 已委托律师事务所提交诉讼,要求法院禁止或限制 X 平台使用个人数据开发人工智能系统,并计划将此案提交欧洲数据保护委员会审议。尽管 X 平台提供了用户退出机制,但 DPC 指出其仍收集了大量欧盟用户数据,诉讼旨在保护用户隐私权益。

🔗 上海发力 AI 教育:高校设备升级在即,人工智能研究迎新机遇!

上海市推出政策支持高校人工智能领域研究,强调设备更新以适应教学需求和安全标准。政策鼓励高校在算力平台、机器人等领域进行建设,特别关注集成电路、人工智能等战略和新兴领域,以提升研究能力和教学质量,推动 AI 赋能传统学科改造,促进科研发展。

🔗 下一个 SpaceX?Anduril 最新估值达 140 亿美元,微软也看中该市场

美国 AI 国防公司 Anduril,由 Oculus 创始人 Palmer Luckey 与 Palantir 早期成员共同创立,专注于国家安全和国防能力提升。公司近期完成 15 亿美元 F 轮融资,估值飙升至 140 亿美元。Anduril 计划扩建制造工厂,投资定制软件,并考虑海外建厂。受益于俄乌战争后美国对国防技术投资的增加,Anduril 已与美军方签订重要合同,包括 10 亿美元的反无人机技术合同。微软和 Palantir 也在争夺国防预算市场,合作整合云计算和 AI 工具,提供包括 GPT-4 在内的软件服务。

✨ 行业观点

🔗 奥特曼秀 5 颗草莓疯狂暗示 GPT-5?匿名新模型神秘现身,数学超强!

Sam Altman 发布的 5 颗草莓图片引发全网对 GPT-5 即将发布的猜想。网友通过草莓成熟周期推测 GPT-5 可能在 4-6 周后发布。同时,LYSMS 竞技场中出现的匿名聊天机器人展现出超凡数学能力,被猜测可能是 GPT-5 的前身。OpenAI 近期高层动荡,但 AGI 目标未变,业界期待其突破性成果。

🔗 国际劳工:ChatGPT 等生成式 AI,影响 1700 万工作岗位

联合国国际劳工组织与世界银行的报告指出,生成式 AI 如 ChatGPT 和 Gemini 可能影响拉丁美洲和加勒比地区 1700 万个工作岗位,其中女性 700 万,男性 1000 万。金融、保险和公共行政等行业将受较大影响。尽管只有 2%-5%的岗位可能被完全替代,但多数工作将经历人机协作模式的变革。教育、法律、医疗等行业预计会从 AI 中获益,提升效率。报告强调数字基础设施的重要性,指出数字鸿沟可能加剧地区不平等。

🔗 曝 Bengio 新动向:世界模型+数学证明,确保 AI 系统正常运作

深度学习三巨头之一 Yoshua Bengio 担任 Safeguarded AI 项目科学总监,该项目由英国 ARIA 支持,旨在通过科学世界模型和数学证明构建一个降低 AI 风险的系统。项目分为支架、机器学习和应用三个领域,Bengio 将专注于提供科学战略建议。提出了"Guaranteed Safe AI"模式,包含世界模型、安全规范和验证器三个核心,以及 L0-L5 安全等级划分。Bengio 与 AI 界其他领军人物共同关注 AI 风险问题,呼吁监管机构全面洞察 AI 发展。

🔗 美国 FCC 提议规范 AI 电话/短信以遏制诈骗

美国联邦通信委员会(FCC)公布提案,旨在规范 AI 生成的电话和短信,以明确其定义并构建消费者保护机制。FCC 要求运营公司披露使用 AI 的电话和短信服务报告,以帮助消费者识别和避免诈骗电话或短信。同时,提案强调保护合法使用人工智能,确保残疾人交流无障碍。FCC 呼吁电信公司共同打击 AI 诈骗行为,以保护消费者安全。

🎡 热门活动

🎡 AI Talk 沙龙 - 第2期|2024.8.22 晚 19:30|线上直播

🎁 AGI 掘金 x 飞书 智能会议纪要 - 体验邀请

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊

相关推荐
NAGNIP8 小时前
一文搞懂深度学习中的通用逼近定理!
人工智能·算法·面试
冬奇Lab9 小时前
一天一个开源项目(第36篇):EverMemOS - 跨 LLM 与平台的长时记忆 OS,让 Agent 会记忆更会推理
人工智能·开源·资讯
冬奇Lab9 小时前
OpenClaw 源码深度解析(一):Gateway——为什么需要一个"中枢"
人工智能·开源·源码阅读
AngelPP13 小时前
OpenClaw 架构深度解析:如何把 AI 助手搬到你的个人设备上
人工智能
宅小年13 小时前
Claude Code 换成了Kimi K2.5后,我再也回不去了
人工智能·ai编程·claude
九狼13 小时前
Flutter URL Scheme 跨平台跳转
人工智能·flutter·github
ZFSS13 小时前
Kimi Chat Completion API 申请及使用
前端·人工智能
天翼云开发者社区14 小时前
春节复工福利就位!天翼云息壤2500万Tokens免费送,全品类大模型一键畅玩!
人工智能·算力服务·息壤
知识浅谈15 小时前
教你如何用 Gemini 将课本图片一键转为精美 PPT
人工智能
Ray Liang15 小时前
被低估的量化版模型,小身材也能干大事
人工智能·ai·ai助手·mindx