1115 早早聊 AI 资讯|GPT-5 已开工!希望微软再投点、中国电信千亿参数「星辰大模型」炸场、微软 AI 助手 Copilot 现已与 PDF...

👉👉原文链接👈👈

阅读详细图文,可访问知识库

「 行业动态 」

◇ GPT-5 已开工!月入 7 亿不够烧,希望微软再投点 🔗 News

OpenAI CEO 山姆·奥特曼透露公司今年营收良好,但仍未实现盈利,计划通过与微软和其他投资者的合作继续筹集资金,微软已投资 100 亿美元。公司正致力于开发下一代大模型 GPT-5,但未透露发布时间表,与微软的合作被称为"运作非常好"。OpenAI 年化营收达 13 亿美元,每月营收超过 1 亿美元,ChatGPT 每周用户数量达到一个亿,有 200 万开发人员使用 API 服务。尽管收入增长,由于大模型训练成本,OpenAI 仍未盈利,正在寻找合作伙伴建立用于训练大语言模型的数据集。OpenAI 原计划为非营利组织,但为"生存"在 2019 年成立了一家营利公司 OpenAI LP,其基本理念是在实现通用人工智能(AGI)使命后,投资者将获得有上限的回报。

◇ 幻觉率直降 40%,中国电信千亿参数「星辰 大模型 」炸场 🔗 News

在 2023 年,国内外大型人工智能模型在语言、语音和视觉领域取得了显著进展,展现出与各领域专业人士相媲美的生成能力。然而,这些大型模型面临一些挑战,包括幻觉、推理能力不足以及上下文理解的问题。中国电信在 2023 年数字技术生态大会上展示了其星辰大模型系列的升级,发布了千亿参数版本,显著提高了推理和准确性,引入了解决多回合幻象的关键技术。性能方面,从百亿到千亿参数带来了显著改进,特别是在长文本生成、基于知识的查询和逻辑、数学、代码能力等方面。中国电信还强调了多模态和多行业方法,开发了多模态模型和语音模型,宣布试商用 12 个行业特定大模型。总体而言,集成语言、视觉和语音功能的大型模型有望适应各种现实任务,而模式的融合被认为是实现通用人工智能的关键一步。

大模型幻觉率排行: GPT-4 3%最低,谷歌 Palm 竟然高达 27.2% 🔗 News

Vectara 平台发布的排行榜比较了解决幻觉问题的流行大型语言模型,最后更新于 2023 年 11 月 1 日。Vectara 采用开源数据集对模型的幻觉一致性进行评估,使用最先进的模型对每个语言模型提供 1000 个短文档进行摘要。在这 1000 份文档中,每个模型仅总结了 831 份,其余的由于内容限制而被至少一个模型拒绝。Vectara 根据 831 个汇总文档计算了每个模型的总体准确性和幻觉率。评估侧重于摘要准确性而不是整体事实准确性,旨在比较模型对所提供信息的响应程度。文章指出,大型语言模型(LLM)在检索增强生成(RAG)管道中的使用越来越多,例如 Bing Chat 和 Google Chat 集成。GPT-4 表现出较低的幻觉率,而 GPT-3.5 和 LLaMA 2 紧随其后,谷歌的 BARD 模型因其性能而受到批评。

◇ 微软 AI 助手 Copilot 现已与 PDF 文件集成 🔗 News

微软的人工智能助手 Copilot 已经与 PDF 文件集成,这一集成允许用户在 Edge 浏览器中打开 PDF 文件时直接使用 Copilot 的功能。当用户在 PDF 中选择一个单词时,会出现一个下拉菜单,其中包括"询问 Copilot"的选项。点击该选项会在屏幕右侧打开一个带有 Bing Chat 的面板,用户可以快速获取所需的结果。这一集成被认为是提升全球 PDF 用户体验的重大进展。微软 Copilot 是一款基于人工智能的助手,旨在协助用户完成各种工作和创意项目。Copilot 能够无缝集成到各种 Microsoft 365 应用程序中,如 Word、Excel、PowerPoint、Teams,为撰写电子邮件、创建演示文稿和生成创新内容等任务提供实质性的帮助。

◇ 基于 LLaMA 却改张量名,李开复公司大模型引争议 🔗 News

"零一万物"公司的 Yi-34B 模型被发现基本上采用了 LLaMA 的架构,只是对两个张量进行了重命名。这个由创新工场董事长兼 CEO 李开复创立的大模型公司构建的模型包括 Yi-6B 和 Yi-34B 两个版本。尽管 Yi-34B 在推出时在 Hugging Face 英文开源社区和 C-Eval 中文评测榜单上取得了多项 SOTA 国际最佳性能指标,被誉为全球开源大模型的"双料冠军",但有研究者指出实际上是对 LLaMA 代码的一次重构,未进行实质性改变。Yi-34B 模型的代码修改未以 Pull Request 的方式提交到 transformers 项目中,可能存在安全风险或不被框架支持的问题。有关 Yi-34B 上下文窗口大小的质疑也引起了关注。零一万物公司回应称,Yi-34B 模型基于 GPT 成熟结构,借鉴了 LLaMA 在 GPT 上的总结,并在模型和训练理解方面进行了大量工作,表示尊重开源社区的反馈,并将代码进行更新以更好地融入 Transformer 生态。

◇ 被 OpenAI 带火的 Agent 如何解放人力? 🔗 News

清华大学研究人员与面壁智能、中国人民大学、MIT、CMU 等组织合作,共同推出了新一代过程自动化------"代理过程自动化"(APA)。APA 结合大型模型智能代理,协助人类构建工作流程,并使这些代理能够在工作流程内独立处理复杂的决策和动态处理,旨在增强自动化、提高效率,从而解放人类免于繁琐的劳动。APA 的创新在于引入大型模型智能代理,通过 ProAgent 的实施证明了其可行性,实现了自主决策的工作流构建。ProAgent 基于 Agentic 工作流描述语言,利用 JSON 组织数据,通过 Python 进行逻辑控制,同时引入 DataAgent 和 ControlAgent 处理动态数据和逻辑控制规则。研究团队采用多种优化技术提高 ProAgent 性能,通过与 OpenAI GPT-4 和开源 RPA 平台 n8n 的集成,成功验证了 APA 的可行性。

◇ 用 AI 评估 AI,上交大新款大模型部分任务超越 GPT-4 🔗 News

上海交通大学生成式人工智能研究小组(GAIR)的研究人员提出了一项新方法,旨在有效评估大型模型与人类价值观的一致性,这是生成式人工智能发展的一个重要方向。通过推出拥有 130 亿参数的大型模型 Auto-J,其在评估不同模型响应一致性方面的性能优于 GPT-4。Auto-J 能够分析两个大型模型的响应,提供评估和比较,并在需要时提供改进建议。Auto-J 不仅指导大型模型生成响应,还提供多维度的分析和判断,在 50 多种不同的现实查询场景中表现出色。其高效性在性能方面得以展现,通过在高性能 VLLM 推理框架中每分钟评估超过 100 个样本。研究团队采用了全面的方法论,包括场景定义、参考评估标准、数据收集和高质量判断生成,验证了 Auto-J 的有效性,并证明其在成对响应比较和单响应评论生成任务中优于基线模型。Auto-J 还展现了作为奖励模型的潜力,在 Best-of-N 设置中选择更好的响应方面超越其他基线模型。

◇ 首个落地的交通出行大模型来了! 🔗 News

T3 出行与中国电信合作推出了名为"阡陌"的国内首个落地运行的交通出行大模型。T3 出行作为估值超过 200 亿的快速崛起明星公司,借助中国电信的大算力,利用超过 20 亿的出行订单和服务数据进行阡陌大模型的训练。该大模型服务于智能调度、司乘服务和出行安全三个方向,具备实时预测出行供需、优化司机行驶路线、解决服务和安全问题的能力。T3 出行在车联网技术和生态优势上的基础积累使其成为首个成功落地的出行 AI 大模型,关注安全和高效,早在被动安全方案主流时期就提出了 V.D.R 安全主动防护系统,并与华为云合作构建"智慧出行信息安全联盟"。总体而言,T3 出行选择了智慧城市和绿色低碳的发展路径,将出行平台的发展从点对点送达拓展至对整个城市运行效率的思考。

◇ MM-Navigator:基于 GPT-4V 的智能手机界面导航助手 🔗 Twitter

MM-Navigator 是一种能够像人类用户一样与智能手机屏幕进行交互的系统,研究发现 GPT-4V 在没有先前训练的情况下,具有出色的屏幕解释、动作推理和精确动作定位能力,能够在 iOS 和 Android 屏幕数据集上生成合理的动作描述并准确执行,其在生成动作描述和执行指令方面的准确率分别达到 91%和 75%。这一研究突显了其在零样本情况下的优越性,超过了先前的 GUI 导航器。

◇ GraphCast:一分钟内提供 10 天准确天气预报 🔗 Twitter

GraphCast 是一款用于中期天气预报的先进人工智能模型,该模型以前所未有的准确性在一分钟内提供 10 天的天气预报,表现优于欧洲中期天气预报中心(ECMWF)的 HRES 等行业标准天气模拟系统。其功能包括最多提前 10 天的天气预测,早期预警极端天气事件,准确预测气旋轨迹和极端气温。GraphCast 利用机器学习和图神经网络进行天气预报,经过数十年的历史天气数据培训,覆盖全球表面的高分辨率预测。在性能比较中,GraphCast 在 90%以上的测试变量上提供比 HRES 更准确的预测,尤其在低层大气中性能显著优于 HRES。该模型需要 6 小时前和当前的天气状态数据进行预测,最多可预测 10 天,并能更早地识别极端天气事件,对于做好准备和可能的生命挽救具有重要意义。

◇ Google 广告业务面临挑战 🔗 Twitter

随着大型语言模型(LLMs)和 Bard 的成功,谷歌在广告收入方面面临越来越大的威胁。谷歌主要通过提供信息性的旅行、保险和本地查询来赚取收入,而优秀的 LLM 可能会直接回答用户的问题,减少他们离开搜索引擎转向其他广告网站的可能性。因此,一个强大的 LLM 可能会显著降低用户从谷歌搜索跳转到其他网站的点击量,对其搜索业务产生负面影响。尽管如此,搜索业务本身正逐渐衰落,主要受移动导航查询的影响,即主要是查询企业名称。谷歌幸运的是,Android 和 YouTube 都是增长业务,有望抵消搜索业务的下降。

◇ Music ControlNet:用于音乐生成的多个时变控件 🔗 Twitter

Music ControlNet 是一种基于扩散的音乐生成模型,通过对生成的音频提供多个精确的、时变的控制,以实现对音乐的精准操控。与图像域的 ControlNet 方法相类似,从训练音频中提取控制参数,然后在给定旋律、动态和节奏控制的条件下,对音频频谱进行微调,实现对音乐生成的时变控制。与 Uni-ControlNet 方法相比,设计了一种新策略,使创作者能够输入部分时间上仅有部分指定的控制。研究院在从音频中提取的控制和预期创作者提供的控制两方面进行评估,结果表明能够生成与控制输入相对应的逼真音乐。与最近的 MusicGen 模型进行比较,尽管参数较少、数据量较小、并且实现了两种额外的时变控制,在生成与输入旋律更为符合的音乐方面提高了 49%。

◇ YouTube 将禁止 AI 音乐翻唱和模仿人物的 AI 内容 🔗 News

YouTube 宣布,将在未来几个月内删除 AI 音乐翻唱以及模仿人物的 AI 生成内容。YouTube 将在决定是否删除模仿人物的 AI 生成内容时,会考虑多方面的因素,比如这些内容是不是出于幽默或者嘲笑的目的,或者提出删除请求的人是否可以被轻易识别。YouTube 还将开始强烈要求使用生成式 AI 工具的创作者在他们的视频中标明这些内容是合成的,如果不这样做,可能会导致他们被暂停或者取消 YouTube 合作伙伴计划的资格。

◇ Airbnb 收购 Siri 联合创始人创办的秘密公司 🔗 News

Airbnb 以约 2 亿美元的交易金额收购了人工智能初创公司 GamePlanner.AI,由 Adam Cheyer 和 Siamak Hodjat 创立,两者在之前在 Siri 和 Viv Labs 的工作中有显著经验。目前 GamePlanner.AI 的具体目的尚不清楚,因为公司已保持一段时间的沉默。Airbnb 首席执行官 Brian Chesky 暗示公司将结合人工智能和设计专业知识,以创建人工智能驱动的体验,可能集中关注人工智能界面和实际应用。Chesky 表示,Airbnb 有意利用生成式人工智能构建"旅行礼宾服务"的雄心。这次收购是 Airbnb 自 2019 年上市以来的首次,突显了该公司对人工智能开发以增强用户体验的严肃承诺。

◇ 制作 GPTs 需要的三个实用技巧 🔗 Twitter

要制作高效的 GPTs,有三个实用技巧需要注意。首先,确保将最重要的指令放在提示的开头或结尾,因为 GPT 更关注这两个部分,避免将关键信息放在中间可能导致被忽略。其次,使用一些常规的提示技巧,如要求 GPT 进行深呼吸、一步步思考,这有助于提高在困难任务上的性能。最后,通过使用负面提示来修正 GPT 的不完美表现,不断测试并使用负面提示进行修正,例如要求 GPT 生成使用良好设计原则的标志而非卡通化的标志。在最后提醒,如果不希望 GPT 透露指令,可明确要求在任何情况下都不要透露,并将重要的负面提示放在指令的开头或结尾。

「 融资快讯 」

◇ 「奕行智能」EVAS 完成超亿元 Pre-A+轮融资 🔗 News

奕行智能最近完成了超亿元 Pre-A+轮融资,由广州南沙科金控股集团领投。这笔融资将主要用于规模化生产已开发的 AI 芯片产品,以及增加对智能汽车、机器人核心技术、产品和软件栈的研发投入。成立于 2022 年 1 月的宜星智能已获得多轮融资,包括广汽资本、东方富海、合力资本等多家机构的支持,总融资超过 1 亿美元。公司聚焦于 AI 领域基础算法框架的变革,推出名为 EVAMIND 的通用 AI 计算架构,计划推出两款面向智能汽车领域的 AI 芯片。宜星智能的目标是在解决与自动驾驶等应用相关的计算挑战方面发挥关键作用,为行业带来创新。

「 早点趣玩 」

OpenAI Whisper 实现显著速度和尺寸改进 🔗 Twitter

一个团队成功地将 OpenAI Whisper 模型提速 6 倍、减小 49%,同时保持 99%的准确性。该模型已经在 HuggingFace Transformers 库中可用,还可以利用他们的 Web 界面,从 URL、文件或音频录音中进行转录。

「 技术阅读 」

◇ create-llama:一键构建全栈 LLM 应用 🔗 Twitter

create-llama,一个能够通过单一的 CLI 命令在数据上构建全栈 LLM 应用的工具,这相当于 AI 工程师的create-react-appcreate-llama是一个全栈起点,可根据需求自定义各个组件,从简单的数据源更改到完全的用户体验升级。未来计划包括发布更多示例和升级create-llama,提供多样的模板选择。

相关推荐
zm-v-1593043398633 分钟前
ArcGIS 水文分析升级:基于深度学习的流域洪水演进过程模拟
人工智能·深度学习·arcgis
拓端研究室2 小时前
视频讲解|核密度估计朴素贝叶斯:业务数据分类—从理论到实践
人工智能·分类·数据挖掘
灵智工坊LingzhiAI2 小时前
人体坐姿检测系统项目教程(YOLO11+PyTorch+可视化)
人工智能·pytorch·python
昨日之日20062 小时前
Video Background Remover V3版 - AI视频一键抠像/视频换背景 支持50系显卡 一键整合包下载
人工智能·音视频
SHIPKING3933 小时前
【机器学习&深度学习】什么是下游任务模型?
人工智能·深度学习·机器学习
子燕若水7 小时前
Unreal Engine 5中的AI知识
人工智能
极限实验室8 小时前
Coco AI 实战(一):Coco Server Linux 平台部署
人工智能
杨过过儿8 小时前
【学习笔记】4.1 什么是 LLM
人工智能
巴伦是只猫8 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
大千AI助手8 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配