👉👉原文链接👈👈
阅读详细图文,可访问知识库
「 行业动态 」
◇ OpenAI 权游决战,董事会要辞职?奥特曼要回归? 🔗 News
OpenAI 目前面临管理层权力争夺的局面,员工强烈支持要求联合创始人 Sam Altman 回归,截至目前,已经有 743 人签署(总共 770 名员工),签名率很快将达到 100%。若辞去董事会,Altman 有可能重新担任 OpenAI 首席执行官。OpenAI 现任首席执行官是 Twitch 前首席执行官 Emmett Shear,曾尝试聘请 GitHub 首席执行官 Nat Friedman 和 Scale AI 首席执行官 Alex Wang 担任临时首席执行官,但未成功。纳德拉强调微软致力于确保 OpenAI 的持续增长和协作。关于 Altman 是否有可能重返 OpenAI 或加入微软存在各种猜测和不确定性。微软首席执行官对 OpenAI 最近的变化持积极态度,强调微软在 AI 技术和创新方面的实力。纳德拉提到调整治理并与董事会对话以确保稳定和客户信任的重要性,并表示对 Altman 的领导力充满信心,强调微软对创新的承诺。OpenAI 的不确定局势引起了投资者的担忧,因为这可能会对他们的投资产生影响,并且可能会导致大规模员工外流。OpenAI 的董事会被描述为主要由非雇员董事组成,在当前情况下建议对管理层进行必要的变动。
◇ Cruise 雪崩:创始人全走了! 🔗 News
Cruise 公司创始人离职的消息传来,联合创始人兼首席产品官 Daniel Kan 宣布辞职,紧随 CEO Kyle Vogt 辞职不到 24 小时。目前,Cruise 陷入困境,面临泥潭、外界质疑以及团队动荡,这家估值超过 300 亿美元的自动驾驶超级独角兽正经历最艰难的时刻。公司最近的事故更使得 Robotaxi 停运、内部裁员、计划中止,同时暂停内部期权兑现。创始人 Daniel Kan 通过短信宣布辞职,曾任首席产品官,尽管表达对 Cruise 能够重回巅峰的信心。公司内外的变数涉及裁员、内部期权兑现停止,加上 Cruise 现金流状况不佳,叠加通用集团本身面临问题。通用集团已经改组 Cruise 的领导层,任命总法律顾问 Craig B。 Glidden 为 Cruise 联席总裁,其他高层也有新的任命。未来展望仍不明朗,尚未确定新的 CEO,通用董事长指出公司将以"安全,透明度和责任制"为工作导向,强调要重获大众信任。
◇ Anthropic 新模型 Claude 2.1 200K 上下文窗口、幻觉率降低 2 倍 🔗 Twitter
Claude 2.1 是一款强大的语言模型,具备行业领先的 200k 标记上下文窗口。此版本在幻觉率、系统提示、工具使用和定价方面实现了 2 倍的降低。通过 API 在控制台上提供,强化了 claude.ai 聊天体验。用户现在能够向 Claude 传递约 150k 字或超过 500 页的信息,具备总结、执行问答、预测趋势和比较多个文档的能力。Claude 2.1 在准确性方面表现出色,相较于 Claude 2.0,虚假陈述减少了 2 倍,显著提升了诚实性,为高性能应用提供了更高的准确性和可靠性。此版本还在长篇文档问答中减少了 30%的错误答案,并展示了 3-4 倍较低的错误断定文档支持特定主张的率。新引入的工具使用功能使 Claude 能够与用户现有的流程、产品和 API 集成,支持开发者通过控制台的工作台功能进行测试,同时还加入了系统提示,使用户能够为结构化一致性提供自定义指令。
◇ ChatGPT Voice 现已向所有免费用户开放 🔗 Twitter
手机上下载该应用程序,然后点击耳机图标即可开始对话。 暂时无法在飞书文档外展示此内容
◇ 图片变视频只需一"指"!Gen-2 运动笔刷免费上线 🔗 News
Runway 上线了 Gen-2 全新功能,名为"运动笔刷"(Motion Brush)。这一创新性的功能允许用户通过刷画的方式使静态图像中的物体动起来,被认为是生成模型可控性的重要里程碑。用户可在 Runway 主页选择"Start with image",上传图片后点击"运动笔刷"按钮,并通过设置水平、垂直幅度和"proximity"值来控制运动效果,生成时间约在 2 分钟左右。通过雪花图的例子展示了运动笔刷的效果,呈现出真实的氛围感。需要注意的是,目前功能主要适用于较慢速的运动,对于快速动作可能效果较差,例如小猫甩尾巴的场景。此外,Gen-2 还上线了其他三项更新,包括 26 个风格预设、导演模式下的摄像头精准控制和图像生成质量的提升,其中包括更高的分辨率、一致性和保真度。
◇ Salesforce 为 OpenAI 研究员提供现金和股权补偿 🔗 Twitter
Salesforce 愿意为所有辞去 OpenAI 职务的研究员提供现金和股权补偿,并欢迎他们加入由 Silvio Savarese 领导的 Salesforce Einstein Trusted AI 研究团队。Salesforce 的 Einstein 人工智能平台本周已完成了 1 万亿次的预测和生成交易,因此他们邀请研究人员加入他们可信的人工智能企业革命。
◇ JetBrains 发布 2023 开发者生态系统现状信息图 🔗 Link
在过去三年中,JavaScript 的使用率有所下降,可能会持续下降,而 Rust 则成为唯一在今年创下受欢迎程度新纪录的编程语言。Objective-C 近年来失去了三分之二的用户,几乎没有理由继续使用。Scala、Go 和 Kotlin 的开发者拥有最高薪酬。在开发者中,只有 5%是女性,存在性别差距,而在韩国,30 岁以下女性程序员占比达 14%,可能是政府政策的结果。开发者最常使用 AI 助手的方式是通过自然语言询问问题。职业倦怠的开发者对心理健康表现出更强烈的兴趣。大多数开发者是通过大学和其他正规教育机构学习编程,而超过一半从事数据科学、机器学习或数据工程领域的开发者是自学的。46%的受访者使用云服务,同样比例的人将测试用例设计作为测试过程的一部分。41%的受访者曾为开源项目做出过贡献,而 61%的受访者实践过协作开发,其中 45%在线上进行,30%面对面进行。
◇ 一加上线 AI 音乐工作室,用户可自由创作 🔗 News
一加近日在其海外官网上线了 AI 音乐工作室(AI Music Studio),为用户提供创作和分享由人工智能生成的音乐的平台。用户可以通过点击官网上的"创建音乐"选项,选择喜欢的流派、情绪和主题,然后点击"继续"以为 AI 提供数据,从而生成个性化的歌词。在几分钟的等待后,AI 将编写歌词、创作音乐和生成音乐视频。此外,一加还围绕 AI 音乐工作室展开了比赛,招募来自印度、北美和欧洲的顶级选手和参赛作品,截止日期为 12 月 17 日。所有获奖者将获得优惠券,可在一加网站上兑换产品。
◇ 用 AI 取代公务员?英国政府计划组建一支特别工作组 🔗 News
英国白厅即将成立人工智能"特别工作组",由 30 名高端技术专家组成,每年预算约 500 万英镑,由副首相奥利弗·道登领导。该工作组旨在提高公务员生产力和缩减队伍规模,将加速信息收集、筛除不相关数据,并提供专业知识解决方案。优先任务包括解决福利欺诈、协助庇护申请,并改革公众与英国国家医疗服务体系之间的关系。尽管使用人工智能在决策中备受争议,但道登表示将与人类决策过程并行,计划将人工智能应用于信件和电话处理,以提高效率,进一步缩减公务员队伍规模。道登认为人工智能应用能够在提高服务质量的同时降低成本,成为白厅雇员人数减少的驱动力。一些经济学家对人工智能提高公共部门生产力表示怀疑,认为升级基础 IT 系统等措施可能更有效。政府已使用约 20 个开源模型,并计划在适当时候与私营公司如 OpenAI 和 Anthropic 等合作。
◇ 开源语言模型比闭源语言模型更安全 🔗 Twitter
开源大型语言模型(LLM)相较于闭源模型更为安全。当前 LLM 是相对无害的,仅基于下一个单词的预测生成文本,不存在突然失控的可能性。已经有多个 GPT 3.5 类模型开源,未出现对人类的灾难性后果。封锁 LLM 因其生成的文本可能有害或导致错误信息的观点不合理,因为互联网和搜索引擎未受审查。此外,尚无证据表明即使未来的 LLM(如 GPT-5)不会出现幻觉或模仿人类推理,它们也永远不会具有行动能力。相比之下,开源模型促进了更多研究,增进了对 LLM 的理解,而不开源可能导致极端的权力斗争、创新受阻以及垄断公司对人类的控制。"
◇ 别拿大模型当「 AI 焦虑症」唯一解 🔗 News
截至 2023 年 7 月,中国已涌现 130 个大模型,各大企业如华为、阿里、百度、腾讯积极发布或更新这些模型。企业在大模型应用上面临 AI 焦虑症,关切如何将其运用到具体业务场景以及解决训练和部署的难题。大模型的挑战包括对计算资源和研发人员的需求,对中小企业构成挑战,同时需考虑投入产出比问题。在通用领域,大模型表现优异,但在垂直行业或专业领域,数据获取和应用问题、以及数据隐私安全问题是挑战。Whale 帷幄提出了"MarketingGPT"概念,专注于企业营销、销售、运营场景,提供全流程、全渠道解决方案,助力企业迎接 AGI 原生的商业未来。相对于通用大语言模型,帷幄提供更数据可控、更懂企业营销场景的"中"模型,通过 AGI 能力训练个性化模型,提高企业内容营销和业务运营效率。垂类大模型具有成本可控、可实现性高、有丰富应用场景的优势,对企业解决实际问题和创造商业价值具有积极作用。
◇ 把大模型装进手机,AI 帮我打工更容易了 🔗 News
各大手机厂商纷纷推出标配大模型,其中 ColorOS 14 在 ODC 2023 大会上展示了其智能助理功能,集成了大模型,实现一键识别屏幕文本和智能摘要。ColorOS 14 的智能助理支持多项 AI 生成能力,包括写大众点评、图像闪速抠图,使整个系统更加智能,支持导航、翻译等功能。在手机办公实测中,ColorOS 14 辅助写短讯、头脑风暴、屏幕文本提取、英文翻译等功能表现出色。系统通过图文并茂快讯一键搞定、文件随心开支持多种格式、中转站功能跨设备流转等实现了便捷的图文处理和文件管理。ColorOS 14 新增泛在服务,在流体云交互下提供实时提醒、复制车次/航班号查看行程等功能,核心技术为 AndesGPT 大模型和潘塔纳尔系统,致力于将手机打造成用户的"第二大脑"并实现跨端互联。在 AIGC 时代,ColorOS 14 对系统和智能助手进行 600+细节升级,注重细节把控,旨在为用户提供更自然的交互习惯。
◇ 带记忆的超级 GPT 智能体 ,能做饭、煮咖啡、整理家务! 🔗 News
卡内基梅隆大学的研究人员开发了 HELPER,这是一个基于大型语言模型和视觉模型的创新模型,旨在解决传统语音助手如 Alexa 和 Siri 在自然语言理解和复杂任务完成方面的限制。HELPER 采用了检索增强方法,将人机对话、命令和错误校正转换为一系列参数化的视觉动作。该模型将语言命令和执行计划存储为记忆,并在类似请求时检索它们,以实现个性化的互动体验。TEACh 的实验数据显示,HELPER 相较于先前的模型,在任务成功率和目标条件成功率方面取得了显著提高。HELPER 通过物理模拟在烹饪、制作咖啡、烘焙、整理卡片和制作饮料等任务中展现了卓越的能力。该模型的技术架构包括规划器、执行器和视觉语言模型。规划器利用检索增强的大型语言模型进行语义解析,生成一系列执行计划,其中包括外部存储器用于文本到程序的映射。执行器解释生成的程序,并根据当前环境执行指令操作,包括场景解析、动作执行、先决条件检查和位置检查。
- Github: github.com/Gabesarch/H...
- paper: arxiv.org/abs/2310.15...
「 融资快讯 」
◇ AI 公司「AI21」C 轮融资 2.08 亿美元 🔗 News
以色列人工智能初创公司 AI21 周二表示,在最近几周又筹集了 5300 万美元,完成了 2.08 亿美元的 C 轮融资。在最新一轮融资后,AI21 已累计融资 3.36 亿美元,估值达 14 亿美元。新资金来自英特尔和康卡斯特旗下的风险投资机构英特尔资本和康卡斯特风险投资公司,此前的投资者包括谷歌和英伟达。AI21 表示,新的融资将增强其向全球企业提供人工智能技术的能力,有助于扩大公司的业务领域,并在 2024 年底前增聘约 100 名员工。
「 技术阅读 」
◇ 从思想链推理到语言代理的指南 🔗 Twitter
这是一篇关于思维链推理(CoT)的精彩摘要,介绍了支持 CoT 技术的基础机制以及它们在语言代理框架中的应用。文章中深入讨论了与 CoT、语言代理和大型语言模型(LLMs)相关的泛化、效率、定制、扩展和安全性等有趣议题,CoT 可能是当今 LLM 开发者最有效的提示技术之一。