奥特曼秀 5 颗草莓疯狂暗示 GPT-5?匿名新模型神秘现身,数学超强!|AGI 掘金资讯 8.9

酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩

🌟 技术突破

🔗 亚马逊文生图 AI 模型 Titan Image Generator 升至 V2 版:可修改 / 编辑细节

亚马逊 AWS 推出了新一代 AI 图像生成模型 Titan Image Generator v2,该模型在初代基础上增加了图像调节、调色板控制、背景移除和主题一致性控制等新特性,提升了用户创作灵活性。利用 ControlNet 技术,用户可通过参考图像和文本提示精确控制图像生成,实现高度详细和结构化的创作,显著提高效率。尽管生成技术成本上升,亚马逊 CEO Andy Jassy 对 AI 技术在云端的发展前景表示信心。

🔗 AI 时代如何遏制优质内容被过度抓取?谷歌探索网络货币化模式

谷歌正在 Chrome 浏览器中开发网络货币化规范,以应对 AI 时代广告收入下降的问题。该方案允许用户通过小额支付直接向内容创作者支付,从而为站长和创作者提供新的营收途径。软件工程师亚历山大·苏尔科夫提出在 Chromium 源代码中引入网络货币化 API,实现无需用户交互的小额支付功能。用户可设置数字钱包,访问网站时自动进行支付,为内容创作者带来更直接的收入支持。

🔗 智驾闯入"无人区",理想汽车郎咸朋:未来一年 10 亿美元只是入场券

理想汽车的智能驾驶研发副总裁郎咸朋透露,公司正在研发基于端到端模型的自动驾驶技术,该技术模拟人类思考和决策过程,由快系统和慢系统构成,分别负责实时控制和复杂逻辑思考。理想汽车的端到端模型是 One Model,与分段式模型不同,直接从传感器数据输出行驶轨迹。郎咸朋强调,高质量数据和充足算力是自动驾驶竞争的关键,理想汽车每年在训练上的投入预计需达 10 亿美元,以保持在智能驾驶领域的竞争力。

🔗 无比顺滑!告别 TTS!贾扬清领衔的 Lepton AI 推出实时语音交互

Lepton AI 由贾扬清领衔,推出了一项创新的实时语音交互技术,该技术通过将 LLM(大语言模型)和 TTS(文本转语音)合二为一,实现了文本和语音的并行处理,大幅减少了首次音频时间(TTFA),提升了对话流畅度。Lepton AI 的技术不仅减少了响应延迟,还引入了动态调整音频片段的高级机制,确保对话连贯自然。此外,该技术与多种开源 LLM 模型兼容,为开发者提供了广泛的应用可能性,预示着未来语音交互体验的大幅提升。

🔗 苹芯科技发布 PIMCHIP 系列 AI 芯片,推动存算一体技术

苹芯科技在北京举办的活动中推出了两款 AI 芯片 PIMCHIP-S300 和 PIMCHIP-N300。PIMCHIP-S300 是一款多模态智慧感知决策芯片,具有高能效、小面积、低功耗和低成本特点,搭载 SRAM 存算一体计算加速单元,能效比高达 27TOPS/W,支持音视频及多传感器接入。PIMCHIP-N300 是面向 AI 领域的专用加速核心,优化了神经网络模型处理,提供 0.5TOPS 单核算力,支持混合精度计算,兼容多种模型部署需求,针对特定应用场景进行了优化。两款芯片的推出旨在提升智能设备和 AI 大模型的计算效率,助力 AI 技术在多场景的应用落地。

🔗 统信发布中国首款操作系统级端侧模型 UOS LM,支持问答、翻译、创作等

统信软件技术有限公司推出中国首款操作系统级端侧模型 UOS LM,实现 AI 完全离线运行,强化数据安全。UOS LM 面向 AI PC 市场,提供个人和组织用户知识库搭建,开发者 AI SDK 接口,以及数据安全保障。该模型搭载本地向量数据库,支持问答、翻译、创作等功能,同时优化系统资源调度和硬件策略,打造硬件友好的操作系统。

💫 企业动态

🔗 OpenAI 宣布 DALL-E 3 模型向 ChatGPT 免费用户开放,但每天只能生成两张图片

OpenAI 宣布对 ChatGPT 的 DALL·E 3 图片生成功能进行重大更新,允许免费用户每天生成两张图片。这一更新标志着 AI 技术在图像生成领域的进一步普及和应用,为创意工作者和普通用户提供了更便捷的视觉表达工具。用户现在可以利用这一功能探索更多创意可能,同时享受 AI 带来的便利。

🔗 最强国产多模态刚刚易主!腾讯混元把 GPT-4/Claude-3.5/Gemini-1.5 都超了

腾讯混元 AI 大模型在 SuperCLUE-V 中文多模态测评基准中超越 GPT-4 等国际模型,成为国内闭源和开源领域的领先者。混元 AI 不仅在表情包理解、照片内容识别等测试中表现出色,还在实用场景如财报摘要分析、学术图表解读等方面展现了强大的多模态理解和生成能力。腾讯元宝 APP 集成了混元 AI,提供便捷的多端访问和聊天记录同步,进一步优化用户体验。

🔗 毒舌 AI 上线!全球 400 万网友破防,竟被这个 AI 骂哭了

推特上新推出的 AI"推特罗伯特"以其犀利的吐槽风格迅速走红,上线 11 天用户数突破 400 万。AI 通过分析用户推文,用幽默且尖锐的语言揭示个性特点,引发网友热烈讨论和自嘲。尽管有时言辞过于尖刻,但这种新型互动方式展示了 AI 在理解和模仿人类语言风格方面的潜力,同时也反映出人们对自我表达和社交互动的新需求。

🔗 阿里云推出首个域名 AI 大模型应用,上线".ai"域名后缀

阿里云在万网焕新发布会上宣布,其域名产品服务已通过 AI 技术升级,推出首个基于通义大模型的 AI 域名应用。用户可输入品牌和行业信息,系统将智能生成并筛选创意域名。新增 40 余个域名后缀,如".ai",并提供 2000 万全球域名资源。同时,推出了域名查询、注册、管理的小程序端口,以及基于域名的"品牌扶持计划",为企业提供优惠和安全服务。阿里云的这一升级,旨在为全球企业和创业者提供更智能、丰富、普惠的域名服务。

🔗 曝 OpenAI 领投 AI 硬件公司 Opal!B 轮融资 6000 万美元

AI 硬件公司 Opal 完成 6000 万美元 B 轮融资,由 OpenAI Startup Fund 牵头。Opal 原以生产网络摄像头为主,现有投资者 Founders Fund 和 Kindred Ventures 预计参与此轮融资。公司计划开发由 OpenAI 模型驱动的新设备,与 OpenAI 紧密合作,探索 AI 技术在办公设备等领域的应用,如创意激发器等。Opal 的转型和合作显示出 AI 技术在硬件领域的广阔应用前景。

🔗 苹果可能会对 Apple Intelligence 收费,月费最高可达 20 美元

苹果公司计划推出名为 Apple Intelligence 的人工智能系统,并可能对其高级功能收取最高 20 美元的月费,以推动服务业务增长。该系统将增强 Siri 并新增自动生成邮件和图像等功能。尽管初期部分地区无法获得,但苹果可能通过 Apple One 订阅模式收费。科技公司为 AI 服务收费已成常态,苹果此举或为整合服务提供新选项。

🔗 马斯克旗下社交媒体 X 因抓取用户数据训练 AI 在爱尔兰被起诉

爱尔兰数据保护委员会(DPC)已对马斯克的 X 平台提起诉讼,指控其未经用户同意擅自使用数据训练 AI 模型 Grok,违反了 GDPR 规定。DPC 已委托律师事务所提交诉讼,要求法院禁止或限制 X 平台使用个人数据开发人工智能系统,并计划将此案提交欧洲数据保护委员会审议。尽管 X 平台提供了用户退出机制,但 DPC 指出其仍收集了大量欧盟用户数据,诉讼旨在保护用户隐私权益。

🔗 上海发力 AI 教育:高校设备升级在即,人工智能研究迎新机遇!

上海市推出政策支持高校人工智能领域研究,强调设备更新以适应教学需求和安全标准。政策鼓励高校在算力平台、机器人等领域进行建设,特别关注集成电路、人工智能等战略和新兴领域,以提升研究能力和教学质量,推动 AI 赋能传统学科改造,促进科研发展。

🔗 下一个 SpaceX?Anduril 最新估值达 140 亿美元,微软也看中该市场

美国 AI 国防公司 Anduril,由 Oculus 创始人 Palmer Luckey 与 Palantir 早期成员共同创立,专注于国家安全和国防能力提升。公司近期完成 15 亿美元 F 轮融资,估值飙升至 140 亿美元。Anduril 计划扩建制造工厂,投资定制软件,并考虑海外建厂。受益于俄乌战争后美国对国防技术投资的增加,Anduril 已与美军方签订重要合同,包括 10 亿美元的反无人机技术合同。微软和 Palantir 也在争夺国防预算市场,合作整合云计算和 AI 工具,提供包括 GPT-4 在内的软件服务。

✨ 行业观点

🔗 奥特曼秀 5 颗草莓疯狂暗示 GPT-5?匿名新模型神秘现身,数学超强!

Sam Altman 发布的 5 颗草莓图片引发全网对 GPT-5 即将发布的猜想。网友通过草莓成熟周期推测 GPT-5 可能在 4-6 周后发布。同时,LYSMS 竞技场中出现的匿名聊天机器人展现出超凡数学能力,被猜测可能是 GPT-5 的前身。OpenAI 近期高层动荡,但 AGI 目标未变,业界期待其突破性成果。

🔗 国际劳工:ChatGPT 等生成式 AI,影响 1700 万工作岗位

联合国国际劳工组织与世界银行的报告指出,生成式 AI 如 ChatGPT 和 Gemini 可能影响拉丁美洲和加勒比地区 1700 万个工作岗位,其中女性 700 万,男性 1000 万。金融、保险和公共行政等行业将受较大影响。尽管只有 2%-5%的岗位可能被完全替代,但多数工作将经历人机协作模式的变革。教育、法律、医疗等行业预计会从 AI 中获益,提升效率。报告强调数字基础设施的重要性,指出数字鸿沟可能加剧地区不平等。

🔗 曝 Bengio 新动向:世界模型+数学证明,确保 AI 系统正常运作

深度学习三巨头之一 Yoshua Bengio 担任 Safeguarded AI 项目科学总监,该项目由英国 ARIA 支持,旨在通过科学世界模型和数学证明构建一个降低 AI 风险的系统。项目分为支架、机器学习和应用三个领域,Bengio 将专注于提供科学战略建议。提出了"Guaranteed Safe AI"模式,包含世界模型、安全规范和验证器三个核心,以及 L0-L5 安全等级划分。Bengio 与 AI 界其他领军人物共同关注 AI 风险问题,呼吁监管机构全面洞察 AI 发展。

🔗 美国 FCC 提议规范 AI 电话/短信以遏制诈骗

美国联邦通信委员会(FCC)公布提案,旨在规范 AI 生成的电话和短信,以明确其定义并构建消费者保护机制。FCC 要求运营公司披露使用 AI 的电话和短信服务报告,以帮助消费者识别和避免诈骗电话或短信。同时,提案强调保护合法使用人工智能,确保残疾人交流无障碍。FCC 呼吁电信公司共同打击 AI 诈骗行为,以保护消费者安全。

🎡 热门活动

🎡 AI Talk 沙龙 - 第2期|2024.8.22 晚 19:30|线上直播

🎁 AGI 掘金 x 飞书 智能会议纪要 - 体验邀请

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊

相关推荐
paixiaoxin33 分钟前
CV-OCR经典论文解读|An Empirical Study of Scaling Law for OCR/OCR 缩放定律的实证研究
人工智能·深度学习·机器学习·生成对抗网络·计算机视觉·ocr·.net
OpenCSG1 小时前
CSGHub开源版本v1.2.0更新
人工智能
weixin_515202491 小时前
第R3周:RNN-心脏病预测
人工智能·rnn·深度学习
Altair澳汰尔1 小时前
数据分析和AI丨知识图谱,AI革命中数据集成和模型构建的关键推动者
人工智能·算法·机器学习·数据分析·知识图谱
机器之心1 小时前
图学习新突破:一个统一框架连接空域和频域
人工智能·后端
AI视觉网奇1 小时前
人脸生成3d模型 Era3D
人工智能·计算机视觉
call me by ur name1 小时前
VLM--CLIP作分类任务的损失函数
人工智能·机器学习·分类
吃个糖糖2 小时前
34 Opencv 自定义角点检测
人工智能·opencv·计算机视觉
禁默2 小时前
2024年图像处理、多媒体技术与机器学习
图像处理·人工智能·microsoft
KeepThinking!2 小时前
YOLO-World:Real-Time Open-Vocabulary Object Detection
人工智能·yolo·目标检测·多模态