👉👉原文链接👈👈
「 行业动态 」
◇ 国产大模型开源一哥再登场,340 亿参数超越 Llama2-70B 🔗 News
悟道·天鹰 Aquila2 强势登顶开源中英双语大模型。Aquila2 系列升级为"Aquila2-34B",在代码生成、考试、理解、推理四个维度的 22 项基准评测中表现出色,甚至优于其他开源基础模型,如"Llama2-70B",表现超越其一半参数大小和三分之二训练数据的情况。这一系列模型包括"AquilaChat2",具备强大的推理和长文本处理能力,适用于多种实际应用。Aquila2-34B 在综合推理数据集基准测试中表现出色,仅次于实现通用人工智能的关键因素"GPT-4"。这一模型系列还展现出出色的泛化能力,并在多个现实场景中得到评估,同时强调了其用户友好性和商业可用性。
◇ OpenAI "在憋大招",构建 ChatGPT 应用成本暴降 95% 🔗 News
OpenAI 计划对 ChatGPT 进行重大更新,计划在 11 月 6 日的开发者大会上正式公布。这次更新的核心目标是降低开发成本,提高效率,以吸引更多开发者参与 ChatGPT 生态系统。具体更新包括引入内存存储和新的开发者工具,包括视觉功能,以便更轻松地应用最新的视觉 AI 技术。OpenAI 还将提供多个领域的示例应用程序,以协助开发者。这标志着 OpenAI 的战略重点从消费者转向开发者,他们认为开发者将成为更为稳定的收入来源。在实现 2024 年 20 亿美元的收入目标方面,OpenAI 正在不遗余力地推进各种举措,包括招聘开发者关系团队和推出 GPT-3.5 Turbo 以及 OpenAI Python SDK 1.0 等功能。
◇ "九章三号"量子计算机问世!比超算快一亿亿倍 🔗 News
我国在量子计算领域取得了显著突破,中科大研制的"九章三号"量子计算机原型机拥有 255 个光子,是其前身"九章二号"的一倍多。"九章三号"创下了多项记录,包括在处理高斯玻色子采样方面比前一代机器快了一百万倍,以及在 1 微秒内处理复杂样本方面比全球最快的超级计算机 Frontier 快了一亿亿倍以上。由中国科学技术大学的研究员领导的团队合作完成,并已在《物理评论快报》上发表。虽然在特定任务上表现出色,但在通用计算方面仍无法与超级计算机竞争。这一突破对于国际学术界具有重要意义,遵循了量子计算的三步发展路线,标志我国在量子计算领域的领先地位再次得到确立。
◇ AI 成功挑战 Google 验证码,多模态模型超越 GPT-4V 🔗 News
谷歌人机验证已经拦不住 AI 了,苹果与哥伦比亚大学的研究人员合作推出了名为"Ferret"的多模态大型模型,它在视觉和文本理解任务中表现优于 GPT-4V。通过提升模型对图像中物体的准确理解和定位能力,增强了其在"看、说、答"任务中的表现。Ferret 融合了"参照"和"接地"概念,以更好地理解图像中的空间关系,这有助于模型区分不同边界框的对象。该模型引入了一种新颖方法,结合离散坐标和连续特征来表示图像中的区域。模型架构包括图像编码器、空间感知视觉采样器和用于生成对象坐标的语言模型 (LLM)。团队创建了 GRIT 数据集,用于评估模型在不同任务中的性能。实验证明 Ferret 在参考和接地任务中表现出卓越性能,特别是在需要对象定位的多模态对话中。
- paper: arxiv.org/abs/2310.07...
◇ 5%成本拿下 SOTA ,"羊驼剪毛"大法火了 🔗 News
普林斯顿大学陈丹琦团队开发了名为 LLM-Shearing 的剪枝技术,以仅用 3 秒的时间在 1B-3B 范围内的大型开源模型中取得了 State-of-the-Art (SOTA)的成果,降低了计算量成本。该方法基于 LLaMA 27B 模型,通过结构化剪枝获得了 1.3B 和 3B 剪枝模型,这些模型在下游任务中表现优异。相比于从头开始训练模型,剪枝被认为更具成本效益。团队建议这一剪枝方法可扩展到其他模型架构和规模,并允许选择高质量的数据集进行进一步的预训练。这一研究强调了 1B-3B 范围内模型的重要性,挑战了之前认为 65B 以下模型有限实际用途的观点。团队还引入了"动态批量加载"以优化数据利用效率,最终修剪后的模型表现出更好的性能。
- paper: arxiv.org/abs/2310.06...
- huggingface: huggingface.co/princeton-n...
- 项目主页:xiamengzhou.github.io/sheared-lla...
◇ 首个支持国产算力生态的强化学习框架 RLLTE 现世 🔗 News
来自香港理工大学、宁波东方大学(暂名)、普渡大学、大疆科技的研究人员和算法团队发布了名为 RLLTE 的开源强化学习框架。现有的强化学习框架存在一些局限性,如活跃期短、缺乏标准化编码实践,以及偏重模型训练而非其他实际需求。RLLTE 旨在解决这些问题,提供模块化组件化的强化学习算法,允许开发者以"乐高"块风格构建算法。该框架具有极端模块化、长期演进、支持数据增强技术、丰富的项目生态系统、完整的基线数据,同时支持多种硬件设备,包括 NVIDIA GPU 和 HUAWEI NPU 进行训练和部署。RLLTE 还集成了大型语言模型,以降低开发者的学习曲线,并提供 copilot 功能,以无需额外培训来提供问题答案,同时确保用户数据隐私。
- paper: arxiv.org/pdf/2309.16...
- 代码 / Demo:github.com/RLE-Foundat...
- 官网:docs.rllte.dev/
◇ Hinton 入局机器人创业,公司新获 9000 万投资 🔗 News
图灵奖获得者、深度学习先驱 Geoffrey Hinton 宣布将加入初创公司 Vayu Robotics,担任顾问一职。Hinton 于 5 月离开谷歌后受到广泛追捧,他自由讨论人工智能风险,并关注道德挑战较少的人工智能应用。Vayu Robotics 是一家成立于 2021 年的专注于人工智能的初创公司,最近获得了 1270 万美元的种子资金,专注于传感器技术、机器学习和低成本高质量机器人产品开发。该公司开发了高能效的送货机器人,使用人工智能视觉技术,而不是传统的激光雷达或高精度地图。Hinton 的加入反映了他对人工智能风险和道德问题的担忧,强调了对负责任和安全使用人工智能技术的需求,以及进行实验和法律监管的必要性。
◇ 打工人遇见大模型:外面的世界已经这样办公了吗? 🔗 News
百度文库利用大型模型实现智能 PPT 生成,节省时间和提高办公效率。它能将 Word 文档转化为 PPT,生成富含数据图表的演示文稿,甚至支持语音生成 PPT。此外还可用于撰写招聘文案、英文文章,生成文章大纲和头脑风暴。尽管大型模型在文本编辑上存在一些限制,如完整性和多样性问题,但百度文库提供多个智能编辑功能,包括文本润色、修订、总结、改变语气等,特别适用于专业性强的文章。它还能生成数据图表和解析,提高文档质量,解决办公跨平台问题,累计用户超过千万,生成内容超过 2000 万。
◇ 谷歌人工智能搜索功能 SGE 现在可以生成图像、写草稿 🔗 News
Google 的人工智能搜索功能 SGE 迎来了新功能,现在引入了对话模式,允许用户根据提示生成图像,同时用户可以自定义 SGE 输出的长度和书写风格。SGE 也快速更新,增加了 AI 驱动的摘要、定义陌生术语、改进的编码、旅行和产品搜索功能等。然而,AI 图像生成功能已限制为 18 岁及以上用户,且 Google 实施了严格的过滤策略以避免不当内容。用户还可以将生成的内容导出到 Google Workspace 应用和 Google Cloud 存储。这些新功能将从明天开始逐步向 SGE 用户推出,未来几周内将扩展到更广泛的用户群,现已在美国以英语提供,最近扩展到印度和日本。
◇ GPT-4 就是 AGI!谷歌斯坦福科学家揭秘大模型如何超智能 🔗 News
谷歌研究院和斯坦福 HAI 的专家认为,现代的 AI 模型已经具备通用人工智能(AGI)的能力,这些模型在多个方面都展现了通用性,包括处理不同话题、任务、模态、语言和可指导性。然而对于 AGI 的存在存在争议,一些人提出质疑,主要因为难以确定 AGI 的度量标准、存在其他 AI 理论,以及担忧人工智能的经济影响,有人提出使用"人工能力智能"来描述这类系统,以避免混淆语言流畅性与智能。同时该领域的发展历史涉及多个智能理论,包括计算机科学、GOFAI 和物理符号系统假说。对于 AGI 的性质、机制和潜在影响也存在多方面的争论,包括符号系统与神经网络、智能测试、意识和代理性,以及与经济发展相关的担忧。 AGI 的出现引发了对其道德和风险问题的深入探讨,需要明确回答"谁受益?"、"谁受害?"、"如何最大化利益和最小化伤害?"以及"如何实现公平和公正?"等问题。
◇ 微调 LLMs 以适应不同用例 🔗 Twitter
对于利用大型语言模型(LLMs)的不同用例,有多种方法可供选择。首先检查响应速度对于聊天机器人模型至关重要,可以使用 Retrieval Augmented Generation(RAG)与 LLMs 结合来满足需要。此外考虑 LLMs 的上下文长度,它可以影响响应质量。尽管增加上下文长度可以提供更多信息,但 RAG 与较短上下文长度模型在 SOTA 准确性方面更出色。最后对于需要领域特定任务的情况,可以考虑微调 LLMs,但性能取决于不同设置和提示工程技巧。
◇ 聊天大模型的输出速度应该是多少? 🔗 Twitter
大型聊天机器人模型的响应速度至关重要,它直接影响用户体验。考虑到日常聊天,模型的输出速度应与人的阅读速度匹配,而 LLaMA2-7B 模型在 A10 GPU 上的测试显示,其输出速度远超过人类阅读需求,支持多达 128 个用户的同时聊天,且有很高的总吞吐量。然而响应速度可能因聊天内容复杂程度而异,且简洁、准确和有用的输出比纯粹的速度提高更为重要。在选择延迟和吞吐量之间要平衡,具体取决于应用程序的需求,而定制和测试是实现最佳性能的关键。需要根据特定用例进行测试和调整,因为不同的模型和方法可能会产生不同的结果。
◇ 指令调优的最大预训练检索增强 LLM 🔗 Twitter
NVIDIA 发布了一篇新论文,介绍了 Retro 48B,这是迄今为止最大的以检索方式进行预训练的大型语言模型。他们继续在一个拥有 43B 参数的 GPT 模型的基础上进行预训练,通过从 1.2T 标记的数据集中进行检索来扩展额外的 100B 标记。Retro 48B 模型在困惑度方面显著改进,超越了其 GPT 43B 的对应模型。通过将 Retro 模型扩展到 48B,可以更有效地进行指导调整,这项工作应用于 Retro 48B,并在零样本问答任务上实现了显著的改善,超过了经过指导调整的 GPT 模型。
「 融资快讯 」
◇ 用 AI 招聘 AI 人才,华裔女生完成千万美元融资 🔗 News
Nancy Xu 于今年 1 月创建了 AI 招聘公司 Moonhub,其 AI 聊天机器人已接受了超过 10 亿份候选人资料的培训,支持诸如 Anthropic 和 Inflection 等 AI 独角兽公司的招聘工作。Moonhub 已吸引了 100 多家客户和 1000 万美元的种子资金,第一年收入超过 100 万美元,用于增强 AI 产品和扩大团队。他们通过一个包含 LinkedIn、Upwork、GitHub 等平台的 10 亿份公开资料的数据库进行培训,还在开发专利申请中的"自定义检索增强生成框架"。Moonhub 计划扩大 AI 的角色,同时确保招聘工具更加公平。这家初创公司提供高效的 AI 替代方案,为客户提供快速找到合适候选人的便捷途径。创始人 Nancy Xu 是斯坦福大学计算机科学博士,被《时代》杂志评为全球 AI 领域 100 名最具影响力的人之一
「 早点趣玩 」
◇ DeepMotion:基于浏览器的 AI 动作捕捉工具 🔗 Twitter
DeepMotion 推出了 DeepMotion Animate 3D 5.0,这是一个基于浏览器的 AI 动作捕捉工具,可以从单个视频中同时捕捉多达 8 个人的动作。只需上传包含人物动作的视频,工具将自动学习和提取这些动作,然后可以将其应用于 3D 角色。支持手部和面部跟踪,包括自动脚部锁定功能,还支持多种输出格式。DeepMotion Animate 3D 5.0 的主要功能还包括多演员跟踪和全面支持移动设备。用户可以在浏览器中完成整个过程,无需额外的硬件或软件。
◇ 20 个 ChatGPT Vision/GPT-4V 提示提升业务 🔗 Twitter
「 技术阅读 」
◇ 2023 年人工智能现状报告 🔗 Link
2023 年报告的关键主题:
- GPT-4 在评估人类水平的基准和测试方面表现出色,超越其他人工智能模型。
- 使用更小的模型、更好的数据集和更长的上下文来克隆或超越专有人工智能性能的努力正在增加。
- 合法的人工智能和扩散模型继续推动现实世界的突破,特别是在生命科学和药物发现领域。
- 计算被描述为"新石油",像 NVIDIA 这样的公司创造了创纪录的利润,初创公司也使用 GPU 作为竞争优势。
- GenAI 重振了风险投资行业,为专注于生成式 AI 应用的 AI 初创公司筹集了超过 1800 亿美元的资金。
- 安全问题已成为主流,促使政府和监管部门采取行动,但人工智能界仍然存在内部分歧和缺乏全球治理进展。
- 评估先进的人工智能模型面临挑战,特别是在鲁棒性方面,并且"基于共振"的方法还不够。
◇ MLOps:构建、部署和管理机器学习模型的完整指南! 🔗 Link
- 什么是 MLOps?
- MLOps 在现代商业中的重要性和好处
- MLOps 生命周期
- MLOps 如何使 ML 生命周期受益?
- MLOps 工具和技术
- MLOps 和数据安全
- MLOps 的未来趋势和挑战
......