1117 早早聊 AI 资讯｜微软自研芯片震撼发布！Copilot 引爆办公全家桶、ChatGPT Bug，GPT-3.5“升级”为 4.0...

阅读详细图文，可访问知识库

「行业动态」

◇ 微软自研芯片震撼发布！Copilot 引爆办公全家桶 🔗 News

微软推出了首款自主研发的全球芯片 Maia，与 Nvidia H100 和 AMD MI300X 竞争。Copilot 宇宙已整合到所有 Microsoft 产品中，包括将 Bing Chat 正式更名为 Copilot。Copilot 提供对 GPT-4、DALL·E 3 和 OpenAI 的自定义 GPT（称为 Copilot Studio）的免费访问，允许用户在同一网页上构建、部署、分析和管理内容。微软开始制造定制芯片，推出专为云基础设施设计的 Azure Maia 100 和 Azure Cobalt 100。Copilot 目前仅限于 Microsoft 最大的客户，微软对 ChatGPT 的关注显而易见，Bing Chat 直接进行了品牌重塑。微软还推出了低代码工具 Microsoft Copilot Studio，允许开发人员构建他们的 GPT 模型并与 OpenAI 的 GPT 无缝集成。Copilot 集成扩展到 Dynamics 365 Guides，将生成式 AI 与混合现实相结合，帮助一线工作人员完成复杂的任务。Maia GPU 采用台积电 5 纳米工艺，内置 RDMA 以太网 IO，超越了 Nvidia 和 AMD 的总 IO 带宽。微软强调了与 Nvidia 的合作重要性，将 Nvidia AI Foundry 服务引入 Azure，承诺及时提供 OpenAI 更新，展示深度合作。

◇ ChatGPT 网页版现重大 Bug，GPT-3.5"升级"为 4.0 🔗 News

据报道，ChatGPT 网页版存在重大漏洞，许多 X 平台上的用户已提供了反馈。用户发现通过修改 ChatGPT 官网聊天页面的 URL，可以轻松从 GPT-3.5 升级到 GPT-4.0，漏洞涉及在网站 URL 末尾添加"/？model=gpt-4-gizmo". 这一漏洞似乎涉及身份验证系统的严重问题。官方团队已意识到此错误并正在积极修复，然而，部分用户仍可通过在 URL 中添加指定后缀访问 GPT-4，这表明该漏洞尚未完全修复。测试是使用未激活 ChatGPT Plus 的帐户完成的，该漏洞可能已经部分解决，因为他们的测试帐户在没有 ChatGPT Plus 的情况下，添加 URL 后缀后无法访问 GPT-4。

◇ 北大华人一作：细化 prompt，大幅改进大模型代码能力 🔗 News

ChatCoder 是由北京大学研究团队开发的方法，通过基于聊天的方式细化需求，提高准确性和完整性，用户充当"产品经理"引导"码农"（LLM）细化需求。通过示例展示了从 ChatGPT 请求 Python 函数的需求细化，解决了术语歧义导致错误代码生成的问题。讨论了需求细化中的挑战，包括客户和供应商在协作过程中的限制。引入 ChatCoder 框架，并评估其在代码生成准确性和通信效率方面的性能，强调 ChatCoder 通过需求细化有效增强了 LLM 代码生成。最后，强调了在解决歧义和提高代码质量的过程中人为干预的重要性，并提供了案例研究证明了 ChatCoder 如何协助 LLM 生成具有细化需求的代码。

paper: arxiv.org/pdf/2311.00...

◇ DevOps 终于有了专属大模型 🔗 News

蚂蚁集团与北京大学合作发布了首个专为中国 DevOps 领域设计的开源大语言模型 DevOps-Model。该模型旨在在整个软件开发和运营生命周期中为开发人员提供帮助，并提供针对 DevOps 过程中问题的解决方案。DevOps-Model 有两种规格：7B 和 14B，包含基础模型和聊天模型，并提供培训代码。为评估其性能，他们推出了首个 DevOps-Eval 基准测试，涵盖规划、编码、构建、测试、发布、部署、操作和监控等八个类别，总计 4850 道选择题。模型的训练采用预训练加微调（SFT）方法，结合来自互联网技术博客、技术文档和书籍的超过 50GB 的预训练数据，并使用 QA 数据进行微调。DevOps-Model 的未来计划包括扩大数据集大小、纳入专门的 DevOps 词汇以增强模型有效性。

Github 地址：github.com/codefuse-ai...

7B 版本

modelscope.cn/models/code...

modelscope.cn/models/code...

14B 版本

modelscope.cn/models/code...

modelscope.cn/models/code...

◇ 一招分辨刷榜作弊大模型 🔗 News

模型领域存在数学水平自评现象，一些声称精通数学的模型通过匈牙利国家数学考试测试其表现。研究发现，一些模型在经典数学测试集 GSM8k 上得分较高，但在新考试中表现下降，可能存在对 GSM8k 数据集过度拟合的情况，被分类为"疑似或已知已接受过 GSM8k 训练"的模型。测试结果以及用户实际经验被认为是可靠的评估手段，包括 Google 学生研究员 Keiran Paster 测试显示 GPT-4 和 Claude-2 等模型在 GSM8k 和新考试中表现良好，OpenAI 的 GPT-3.5 Turbo 和 Meta 的 Mistral 系列也表现出良好性能。文章讨论了各种开源模型（如 Code Llama、Llemma 和 Mistral），强调它们在数学任务中的优缺点。存在对潜在过度拟合和大型语言模型持续评估机制的担忧，建议包括创建专门的模型评估公司或建立每年更新的基准来解决过度拟合问题。

◇ 掰开安卓手机，满屏都是三个字： 大模型 🔗 News

智能手机制造商正在迎接"模型力量时代"，将大型人工智能模型整合到其产品中以提升 AI 和生成内容应用。OPPO 升级语音助手，vivo 开发自家 AI 大模型，小米在产品发布中引入大型模型。这一趋势与芯片发布的竞争相辅相成，被认为是硬件支持机器学习和大型模型的"模型强国时代"。高通等芯片制造商在产品发布中突出其芯片对机器学习的支持。挑战包括计算能力、内存和功耗，高通的第三代 Snapdragon 8 移动平台以 Hexagon NPU、传感中心改进和增强内存支持应对。同时，跨平台连接和兼容性对成功部署大型模型至关重要，以高通的 Snapdragon Seamless 技术为例，实现了设备之间的流畅交互。总的来说，智能终端制造商需要整合软硬件能力，为"模型强国时代"智能终端互联的未来做好准备。

◇ Meta 推出 EmuVideo：通过显式图像调节分解文本到视频的生成 🔗 Twitter

在各种提示下将 Emu Video 与最先进的文本到视频生成模型进行比较，要求人类评分者根据质量和对提示的忠实度来选择最有说服力的视频。可以生成 512x512 分辨率、16 帧每秒的 4 秒短视频。这个想法非常简单：首先将文本转换为图像，然后沿着时间轴进行"超分辨率"处理，以合成运动。

◇ 短短 72 小时，OpenGPT 再次变身 🔗 Twitter

文件上传增强：在摄取、向量存储和检索方面，文件上传功能现在是完全可定制的。

公共机器人共享：用户现在可以与公众分享他们自定义创建的机器人。

工具扩展：访问维基百科、Arxiv、YouSearch 等许多其他专业工具。

互动反馈：与 LangSmith 集成，用于用户反馈。

聊天历史存储：具备存储聊天历史以改善用户互动的能力。

◇ 谷歌与 YouTube 合作推出人工智能音乐生成模型 🔗 Twitter

谷歌宣布与 YouTube 合作推出由 Google DeepMind 设计的先进人工智能音乐生成模型 Lyria，旨在为音乐创作提供新的创意路径。Lyria 能够使用乐器和人声生成高质量音乐，执行转换，并允许用户控制输出的风格和性能。在名为 Dream Track 的实验中，Google 和 YouTube 在 YouTube Shorts 上进行合作，让有限的创作者使用 Lyria 生成的 AI 声音和各种艺术家的风格制作独特的配乐，包括 Alec Benjamin、Charlie Puth、Charli XCX 等。该实验旨在测试通过音乐创作连接艺术家和粉丝的新方式。谷歌的研究人员与 YouTube 音乐 AI 孵化器中的艺术家、词曲作者和制作人合作，探索生成式 AI 如何最好地支持创作过程。用户可以利用谷歌的音乐人工智能工具创作新音乐、改变音频风格或乐器，并开发器乐和声乐伴奏。团队正在研究使用 SynthID 对 AI 生成的音频进行水印处理，保持可检测性，以负责任地开发和部署生成音乐技术。谷歌设想生成音乐技术将改变音乐创作的未来，并致力于与创意社区合作制定负责任的开发和部署标准。

暂时无法在飞书文档外展示此内容

◇ 韩国 央行 警告： AI 或抢走该国 400 万人的"饭碗" 🔗 News

韩国央行发布了一份关于人工智能（AI）对该国劳动力市场影响的报告。报告预测，未来 20 年，人工智能可能导致韩国多达 400 万个就业岗位消失，占就业岗位总数的 14%。分析显示，由于人工智能在执行分析和认知任务方面的效率，受教育程度和收入水平较高的工人面临更大的风险。职业如化学家、医生、律师、会计师和资产管理人被认为最容易被人工智能取代，而餐饮、教育和音乐等行业的工作相对较安全。预计人工智能的发展将增加对 STEM（科学、技术、工程和数学）教育以及沟通和团队合作等软技能的需求。报告还指出，人工智能有助于韩国解决人口老龄化问题。韩国目前是全球机器人使用率最高的国家之一，但在人工智能利用率方面与其他国家相比仍有差距。该调查结果与高盛、麦肯锡等其他机构的警告一致，强调了人工智能的双重性质，即既可以提高生产力，也可能破坏就业。

◇ 使用形状引导扩散的单图像 3D 人体数字化 🔗 News

研究人员提出了一种从单一输入图像生成具有一致、高分辨率外观的人物 360 度视图的方法。与 NeRF 及其变种通常需要来自不同视点的视频或图像不同，该方法利用了预先训练的高容量 2D 扩散模型，作为着装人体外观的先验。为了实现更好的 3D 一致性，同时保持输入身份，采用了逐步合成输入图像中人物的多个视图，通过在轮廓和表面法线条件下进行形状引导的扩散。随后，通过逆渲染将这些合成的多视图图像融合，得到给定人物的完全纹理化的高分辨率 3D 网格。实验证明，该方法优于先前的方法，并成功实现了从单一图像中合成复杂纹理的广泛服装外观的逼真 360 度合成。

paper: huggingface.co/papers/2311...

◇ 剑桥词典公布 2023 年度词汇：Hallucinate 🔗 News

剑桥词典宣布 2023 年的年度词汇为"hallucinate"（产生幻觉）。在这一语境中，hallucinate 指的是在不良健康状态或药物影响下产生的幻觉，包括看到、听到、感觉到或闻到"一些不存在的东西"。随着人工智能的崛起，hallucinate 的含义扩展为 AI 产生幻觉，即生成错误的信息。剑桥词典新增了约 6000 个与 AI 相关的字词及定义，包括"prompt engineer"（提示工程师/ AI 沟通师）、"large language model"（大型语言模型）和"GenAI"（生成式 AI）。剑桥词典的出版经理强调，人类在使用这些工具时需要运用批判性思维技能。

「融资快讯」

◇ 智能工厂 解决方案提供商「零可达科技」完成千万级天使轮融资 🔗 News

汽车零部件行业的智能工厂平台提供商零可达宣布完成千万级天使轮融资，由用友产投领投，上海坤德信息科技跟投。这笔资金将主要用于产品迭代和市场推广，旨在提升汽车零部件交付效率。自 2009 年新能源汽车财政补贴推出以来，新能源汽车行业呈现蓬勃发展，订单销售模式逐渐取代传统库存销售，为上游供应链带来挑战。零可达提供智能工厂平台、制造运营管理系统（MOM）、供应链管理系统（SCM）、数字化精益系统（Digital LPS）、AI+制造技术等解决方案，业务逻辑基于离散制造、批量制造及流程性行业特点，通过数字化实现订单交付流程的优化。公司的目标客群定位在中腰部制造企业，强调产品的高标准化、高集成度、高拓展性和高性价比。

「早点趣玩」

◇ 只需绘制即可创建工作 UI 🔗 Twitter

这是一个使用 tldraw 和 gpt-4-vision api 根据绘制的线框生成 html 的应用程序。其工作原理是获取当前画布 SVG，将其转换为 PNG，然后将该 png 发送到 gpt-4-vision，并附有指令以返回带有 tailwind 的单个 html 文件。

地址：makereal.tldraw.com/

「技术阅读」

◇ 评估多模态 RAG 系统的首个指南 🔗 Link

图像检索

使用标准的检索度量（命中率、MRR）来评估图像检索。

比较要点：

CLIP 嵌入是否比使用 GPT-4V 生成的文本嵌入更适用于图像检索？

从图像+文本生成

由于输出是文本，我们可以使用现有的基于 LLM 的评估概念：忠实度、相关性、正确性等。

比较要点：

CLIP 图像编码器，GPT-4V 用于生成

CLIP 图像编码器，LLaVa 用于生成

生成文本编码，GPT-4V 用于生成

生成文本编码，LLaVa 用于生成

指南：docs.llamaindex.ai/en/stable/e...

1117 早早聊 AI 资讯｜微软自研芯片震撼发布！Copilot 引爆办公全家桶、ChatGPT Bug，GPT-3.5“升级”为 4.0...

「 行业动态 」

「 融资快讯 」

「 早点趣玩 」

「 技术阅读 」

「行业动态」

「融资快讯」

「早点趣玩」

「技术阅读」