1211 - 1215 早早聊 AI 资讯｜GPT-2 能监督 GPT-4，Ilya 带头 OpenAI 超级对齐首篇论文来了、OpenAI...

阅读详细图文，可访问知识库

「 OpenAI 」

◇ GPT-2 能监督 GPT-4 ，Ilya 带头 OpenAI 超级对齐首篇论文来了 🔗 News

OpenAI 首席科学家 Ilya Sutskever 表示，模型若能预测下一个词，即可理解深刻现实，暗示未来可能诞生超越人工智能的系统。OpenAI 的"超级对齐"团队发布首篇论文，以弱监督训练强模型。在 NLP 任务、国际象棋及奖励建模任务中，研究发现通过简单方法可显著提高弱到强的泛化。此举引发对"超级人工智能"可能带来负面影响的担忧。

◇ OpenAI 计划扩大其在印度的业务 🔗 Twitter

OpenAI 计划拓展印度业务，多家公司发布人工智能更新，包括 Google 的 Gemini，LangChain 的 RAG 应用模板，苹果的 MLX 框架，Microsoft Copilot 整合 GPT-4 和 DALL.E-3，Meta AI 的 Imagine，Scale AI 的 AFM-1 车辆模型，Playground AI 的新模型。Llama 数据集用于 RAG 测试，Generative Powers of Ten 突破传统超分辨率技术。AI 飞速发展，这只是开始。

◇ OpenAI 与出版巨头施普林格达成史无前例的协议，为 ChatGPT 提供新闻数据 🔗 News

新闻出版公司施普林格与 OpenAI 达成划时代协议，允许 ChatGPT 总结 Politico 和 Business Insider 等媒体的新闻文章。这是全球首个将新闻业与人工智能更深度整合的出版机构，为在 AI 工具中使用其内容而争取资金补偿的重要里程碑。协议生效后，ChatGPT 将使用施普林格旗下媒体的文章作为回应，并标注来源以保证透明度。

◇ OpenAI ：推出 Converge 2 加速器计划 🔗 News

OpenAI 创业基金推出 Converge 2 加速器计划，旨在支持杰出工程师、设计师和研究人员，以及致力于用人工智能重新构想世界的产品开发者。计划通过技术讲座、办公时间和社交活动，与领先从业者对话，共同探索人工智能前沿的机遇和挑战。参与者将获得 100 万美元投资和创业社区支持。

◇ ChatGPT 成为 Nature 年度十大人物，首个非人类实体 🔗 News

《Nature》2023 年度十大人物中，首次包括大型语言模型 ChatGPT。该模型在科学领域取得深远影响，与人类合作起草科学论文，并在项目中扮演重要角色。然而，生成式 AI 技术也存在潜在危险，可能被滥用。模型的创造者之一是 OpenAI 首席科学家 Ilya Sutskever，他一直致力于创建超越人类智能的通用人工智能系统。ChatGPT 的入选引发对 AI 局限性、人类智能本质及相互作用调节的讨论。

「行业动态」

◇ Gemini 激战 GPT-4 ，数学代码却惨遭碾压 🔗 News

Gemini 和 GPT-4 展开大 PK，代码和数学 Gemini 惨遭 GPT-4 碾压，但在讲笑话和写作方面，Gemini 的答案却意外地幽默。Gemini Pro 与 GPT-4 进行比较，结果显示 ChatGPT 略胜一筹，但 Gemini 取得了巨大进步。Gemini Ultra 和 OpenAI 神秘 Q*技术集成的新模型可能会在未来进行真正的巅峰对决。在几个测试中，ChatGPT 在编程、数学和创意写作方面取得优势，但在笑话创作上达成了平局。在事实检索问题和辩论对话中，GPT-4 的表现更胜一筹。

◇ 百度文心一言版 Copilot 来啦，你的办公超级助理！🔗 News

百度文心大模型 4.0 在核心能力上全面提升，与 GPT-4 相媲美。百度智能云推出基于文心一言的 AI 原生应用"超级助理"，提供智能办公体验，支持简历优化、信息查询、市场调研、方案创作、论文摘要等功能，助力职场新人、业务专家和行业大牛提升工作效率。

◇ 困扰数学家几十年的难题， 大模型发现全新解 🔗 News

谷歌 DeepMind 的研究团队提出了一种名为 FunSearch 的方法，利用大型语言模型（LLM）解决数学和计算机科学问题。通过将 LLM 与自动评估器配对，FunSearch 避免了生成虚假信息，发现了数学中长期存在的开放问题 cap set 的新解决方案。该方法为科学家提供了可理解的算法，推动了科学发现的良性循环，并展示了 LLM 在解决实际问题上的潜力。FunSearch 在深度学习领域的创新为科学和工程挑战提供了新的可能性。

◇ 谷歌 DeepMind 最先进 Imagen 2 发布：这些 AI 图片你能辨别吗？ 🔗 News

Google 推出 Imagen 2，升级文本到图像扩散技术，提供更高质量、逼真输出。通过改进数据集和模型，Imagen 2 解决了渲染手和人脸的问题，还支持修补和扩图技术。为提高用户提示理解，谷歌加强了图像描述，训练美学模型，调整生成图像的风格。安全方面，引入 SynthID 水印工具，并采用严格的防护措施。

◇ 还争什么「新闻女王」， AI 要 7x24 小时播新闻了 🔗 News

新兴 AI 新闻公司 Channel 1 发布的 demo 引起热议，其 AI 主播形象逼真、语音流畅，支持多语种播报。公司表示主播由类似于 ChatGPT 的复杂模型支持，具有独特个性和灵活性。尽管存在对新闻真实性的担忧，Channel 1 承诺通过独立记者、政府文件和外部机构等可信来源确保内容真实。与传统新闻不同，Channel 1 计划提供由观众选择观看的个性化新闻，成本低且预计 2024 年 2 月上线。

◇ 华中科技大学开源多模态大模型 "Monkey" 🔗 News

华中科技大学软件学院的 VLRLab 团队发布了多模态大模型"Monkey"，在 18 个数据集上的实验中表现出色，尤其在图像描述和视觉问答方面超越了微软的 LLAVA、谷歌的 PALM-E 和阿里的 Mplug-owl 等知名模型，甚至在文本密集的问答任务中超越了 OpenAI 的 GPT-4V。Monkey 具有"看图说话"能力，可处理分辨率高达 1344×896 像素的图像，是其他模型最大尺寸的 6 倍。

◇ 全方位、无死角的开源，邢波团队 LLM360 让 大模型 实现真正的透明 🔗 News

开源模型正在展现蓬勃生命力，但闭源策略限制了其发展和妨碍了人工智能领域的进步。为此，研究者们提出 LLM360，一个全面开源的人工智能模型倡议，旨在透明化模型训练过程，包括数据、代码、模型检查点等。AMBER 和 CRYSTALCODER 是 LLM360 的两个开源模型，分别基于 1.3T 和 1.4T token 进行预训练。项目详细框架着重于训练数据、代码与配置、模型检查点以及性能指标的公开，旨在推动开放、协作的人工智能研究。

◇ 迈向 100 倍加速：全栈 Transformer 推理优化 🔗 News

符尧是爱丁堡大学博士生，研究 OneFlow 编译翻译。文章探讨了 Transformer 推理的全栈优化，从硬件规格、FlashAttention 到 vLLM 等 MLSys 方法，以及专家混合等模型架构。总体而言，文章强调 Transformer 推理受内存限制，优化应基于提高 FLOP 利用率。阐述了 GPU 架构、内存层次结构、Flash Attention 等内容，并对推理效率和吞吐量进行了讨论。

◇ 微软小模型击败大模型 ：27 亿参数，手机就能跑 🔗 News

微软公布了 Phi-2 模型，这是一款只有 27 亿参数的小型语言模型，表现超越了大型模型如 Llama2 和 Mistral，尤其在常识推理、语言理解、数学和编码任务上表现出色。Phi-2 的关键亮点包括通过小型模型实现大型模型的性能、优化训练数据质量以及知识迁移技术。Phi-2 将成为研究人员的理想模型，可用于各种实验和探索。

◇ 微软发文：27 亿参数的 Phi-2 AI 模型性能优于谷歌 32 亿参数的 Gemini Nano-2 🔗 News

微软宣布旗下 Phi-2 2.7B 模型性能超越谷歌 Gemini Nano-2 3.2B。Phi-2 在逻辑推理和安全性方面显著改进，拥有 27 亿参数，性能比 Gemini Nano-2 高出 10 倍。微软指出 Phi-2 在多方面优于 Gemini Nano-2，包括超过 Llama-2 和 Mistral 模型。

◇ 阿里最新研究：一张人脸一句话就能跳舞，服装背景随意换！ 🔗 News

阿里发布最新研究 DreaMoving，通过一张脸部照片和简短描述，实现任何人随时随地跳舞，包括卡通动漫人物。挑战在于缺乏开源舞蹈视频数据集和准确文本描述。阿里团队收集了 1000 个高质量人类舞蹈视频，用 Minigpt-v2 生成文本描述，采用 DreaMoving 模型，包含去噪 U-Net、视频控制网络和内容引导器。

◇ 让大模型操纵无人机，北航团队提出具身智能新架构 🔗 News

北京航空航天大学智能无人机团队提出一种基于多模态大模型的具身智能体架构，将其应用于无人机操控。研究团队通过 ROSchain 连接大模型与机器人系统，构建了智能体 AeroAgent，具备多模态感知、自动计划生成和具身智能动作等模块。在模拟实验中，AeroAgent 在火灾搜救、着陆任务、风机巡检和导航任务中表现卓越，显示出潜在的工业应用前景。

◇ Grok 出现"幻觉"，误认为自己是 OpenAI 的产品 🔗 News

埃隆・马斯克旗下的 xAI 公司推出全新人工智能聊天机器人 Grok，面向美国 Premium+ X 用户。Grok 采用 Grok-1 模型，与 OpenAI 的 ChatGPT 所用 GPT-4 模型不同。Grok 整合 X 平台实时数据，提供根据最新动态的实时回应，但存在"幻觉"问题，生成包含虚假信息的回应。xAI 工程师解释称该问题罕见，未来版本将避免类似问题。AI 聊天机器人安全和可信性是未来研发的关键课题。

◇ 零一万物 Yi-34B-Chat 微调模型上线，登陆多个权威榜单 🔗 News

Yi-34B-Chat 微调模型在 AlpacaEval 评测中以 94.08%的胜率超越多个竞争对手，包括 GPT-4。在 LMSYS ORG 排行榜中，以 1102 的 Elo 评分追平 GPT-3.5。SuperCLUE 中文排行榜显示 Yi-34B-Chat 在中文领域取得进步，胜率达 31.82%。该模型在多个应用场景中表现出色，由于 Yi 系列强基座和 AI 对齐技术的贡献，成为开源界备受关注的模型。

「趣玩推荐」

◇ WonderJourney：根据文本描述或图片，生成 3D 场景的连续画面用 🔗 Twitter

WonderJourney 是由斯坦福大学和谷歌合作开发的项目，通过用户提供的文本描述或图片，自动生成多样化而连贯的 3D 场景序列。用户可以从任意起始点开始，经历长时间的虚拟旅程，探索多样的目的地。这个创新项目利用大语言模型、文本驱动的点云生成管道和视觉语言模型，确保生成的场景在视觉上连贯且多样化。

「学习资源推荐」

◇ Sebastian Raschka 分享 十一 月的研究论文 🔗 News

这篇文章关注大型语言模型（LLMs）的三个问题领域：减少幻觉、增强小型模型的推理能力以及深化对 Transformer 架构的理解。减少幻觉是因为 LLMs 有时会生成似是而非的信息，提出使用 Direct Preference Optimization（DPO）进行微调，显著降低幻觉发生率。改进小型模型的推理能力对于弥合开源和私有 LLMs 之间的差距很重要。另一方面，深入理解 Transformer 架构有助于简化模型，提高性能。总体而言，这些研究对 LLMs 的进一步发展提供了有益的见解。

◇ 使用 LangChain 和 Vespa 流模式为分片数据增强 RAG 🔗 Twitter

这篇实践指南介绍了如何将 LangChain 与 Vespa 流模式连接，构建经济高效的 RAG（Retrieval-Augmented Generation）应用程序。通过 Vespa 的流搜索解决方案，有效地在自然分片的数据上进行低延迟搜索，而无需将数据保留在内存中。博文还提供了连接 LangChain Retriever 与 Vespa 的步骤，实现从 PDF 文档中检索上下文的方法。

「智能硬件：智能硬件、机器人、智能穿戴设备...」

◇ 首个 GPT-4 驱动的人形机器人！无需编程+零样本学习，还可根据口头反馈调整行为 🔗 News

东京大学和 Alternative Machine 公司的研究展示，用 GPT-4 语言模型操纵人形机器人 Alter3，无需编程或训练，仅通过口头指令。机器人表演各种滑稽动作，引发网友热议，尽管动作怪异，但符合指令。这一研究探索了 GPT-4 控制机器人动作的能力，减少人机交互的复杂性，采用 CoT 和 zero-shot 技术，使 Alter3 能理解自然语言并执行任务。

◇ 练习时长两年半，特斯拉人形机器人 Optimus 二代上线 🔗 News

特斯拉人形机器人「Optimus」第二代在特斯拉 AI 日活动上惊艳亮相，得益于特斯拉设计的致动器和传感器的改进，行走速度提高 30%，重量减轻 10 千克。机器人具备优雅的双手，11 个自由度，能够处理精致物体，如鸡蛋，演示视频表明所有动作均为实时无 CGI 效果。随着进步，实现机器人管家的设想似乎离我们不远。

「投融资信息」

◇ 创富港战略投资「点漾科技」，加速 AI 大模型应用项目落地 🔗 News

创富港副总裁唐伟代表公司与点漾科技签署战略投资协议，投资资金将用于点漾科技的技术研发和业务扩展。创富港致力于紧跟科技发展，认为投资 AI 大模型是未来趋势，此举标志着在大模型技术应用上迈出关键一步。双方将展开深度战略合作，加速实现 AI 客服、AI 销售、AI 财税等大模型应用项目的落地，推动人工智能技术在共享办公领域创新应用。

◇ Transformer 一作再创业！新获 4 亿融资，谷歌英伟达 AMD 参 🔗 News

中国大模型初创公司 Essential AI 成立不到一年即获得约 4 亿人民币的 A 轮融资，投资者包括谷歌、英伟达、AMD 等科技巨头。Essential 专注于基于大模型的全栈型智能产品，致力于通过 AI 技术弥合人与计算机在知识和技能方面的鸿沟。公司由 Transformer 论文的作者 Ashish Vaswani 和 Niki Parmar 创立。

◇ 红杉美国和 Index 5400 万美元投资了这家德国 AI 供应链公司！ 🔗 News

德国初创公司 Tacto Technology GmbH 以 5400 万美元融资完成。该公司通过 AI 技术帮助企业识别成本节省机会，降低采购支出约 10%。总部位于慕尼黑的 Tacto 专注于解决工业企业在供应链管理中的复杂性和挑战，通过数字化采购和优化资源，创造可持续供应链，为中小型企业提供解决方案。投资由 Sequoia Capital 和 Index Ventures 领投，突显对可持续性和企业软件公司的关注。

1211 - 1215 早早聊 AI 资讯｜GPT-2 能监督 GPT-4，Ilya 带头 OpenAI 超级对齐首篇论文来了、OpenAI...

「 OpenAI 」

「 行业动态 」

「 趣玩推荐 」

「 学习资源推荐 」

「 智能硬件：智能硬件、机器人、智能穿戴设备...」

「 投融资信息」

「行业动态」

「趣玩推荐」

「学习资源推荐」

「智能硬件：智能硬件、机器人、智能穿戴设备...」

「投融资信息」