👉👉原文链接👈👈
「 最新活动 」
◇ 杭州 AI 峰会:AI 最后一公里,变现探索 🔗 Link
AI 浪潮,一起搞钱!早鸟有限,详情链接:xhkzr.xet.tech/s/2LquL0
「 行业动态 」
◇ 中文最强开源大模型来了!130 亿参数,0 门槛商用 🔗 News
开源最彻底的大模型来了,昆仑万维近日发布了 Skywork-13B 系列,其中包括 Skywork-13B-Base 和 Skywork-13B-Math 两个版本。这个系列大模型拥有 130 亿参数以及 3.2 万亿高质量多语言训练数据,在生成、创作、数学推理等任务上表现突出。此外,昆仑万维还慷慨地将其中文数据集 Skypile/Chinese-Web-Text-150B 一同开源,为开源社区和开发者提供了巨大的资源。这一开源行为无需商用申请,同时也提供了轻量版大模型,可在消费级显卡上进行部署和推理。这一开源举措的背后是昆仑万维的坚定信念,旨在降低大模型的使用门槛,为 AI 应用的未来发展提供更多可能性。
- Skywork-13B 下载地址:modelscope.cn/organizatio...
- Skywork-13B 下载地址:github.com/SkyworkAI/S...
◇ MIT 研发 GATE:智能对话生成提示词 🔗 Twitter
麻省理工学院的研究人员开发了一种名为 GATE(Generative Active Task Elicitation)的框架,它通过与用户进行主动开放式对话来了解其需求,从而为大规模语言模型(LLMs)生成更有效的提示词(Prompt)。该框架通过开放式互动、用户反馈和模型更新的迭代流程,准确地理解和满足用户的需求。这种方法不仅减轻了用户为模型预先准备信息的负担,而且可能引导用户考虑之前未曾思考过的问题。GATE 已在内容推荐、道德判断和电子邮件验证等领域进行了实验。
- Github: github.com/alextamkin/...
- Paper: arxiv.org/abs/2310.11...
◇ 苹果前员工创企下月发布智能设备,内置 ChatGPT 🔗 News
Humane 宣称将通过创新的计算方式探索更理想的人机交互体验,并暗示正在开发某种穿戴式 AR 设备,将于 11 月 9 日发布首款可穿戴设备 Ai Pin,这是一款小型无屏幕设备,大小与饼干差不多,内置 ChatGPT,配备摄像头、麦克风、扬声器、各种传感器和激光投影仪,可以通过磁铁吸附在衣服上。消息人士称,Ai Pin 预计售价 1000 美元,并需要每月订阅数据。Humane 由苹果前设计总监 Imran Chaudhri 和前软件工程总监 Bethany Bongiorno 于 2018 年创立的创业公司。
◇ 苹果推新模型 MDM:高分辨率图像生成再突破 🔗 News
苹果开发了一种名为俄罗斯套娃式扩散模型(Matryoshka Diffusion Models,MDM)的新型高分辨率图像生成模型,采用嵌套 UNet 架构和多分辨率扩散过程,旨在解决高分辨率生成的挑战。此模型结合了多分辨率损失和渐进式训练,不仅提高了训练效率和模型质量,还在多个生成应用中展现出零样本能力。
- Paper: arxiv.org/pdf/2310.15...
◇ 低代码遇上 AI:AIGC 推动数字化业务新风潮 🔗 News
专业社区关注大语言模型(LLM)如微软 OpenAI、百度文心一言等的发展,并专注于 LLM 的市场研究和 AIGC 开发者生态。尽管低代码因生成代码的不确定性、维护成本等问题受到质疑,但 AIGC 的出现为其带来了新机会。多家公司如 Microsoft Power Platform 和钉钉宜搭都将 AIGC 整合到他们的低代码产品中,使得生成式 AI 能根据描述快速生成应用程序。AI 结合低代码正在加速应用程序开发,降低技术门槛,提高代码质量,减少维护成本,使得非技术人员也能轻松构建企业数字化流程和应用。
◇ 全球最长上下文窗口大模型发布:百川智能 Baichuan2-192K 🔗 News
百川智能发布了全球上下文窗口最长的 Baichuan2-192K 大模型,窗口长度高达 192K,可一次处理约 35 万汉字,性能显著超越其他长窗口模型。该模型在多项长文本评测中取得了优异表现,并已在法律、媒体等实际场景中应用。Baichuan2-192K 结合算法和工程创新,不仅技术上有所突破,还为学术领域提供了新的研究方向。百川智能已开放 Baichuan2-192K 的 API 内测,预计不久后将全面开放,进一步助力行业的降本增效。
◇ 微软 CEO:付费 Github Copilot 用户已超过 100 万 🔗 News
微软 CEO 萨蒂亚・纳德拉宣布,在第三季度,GitHub Copilot 的付费客户增长了 40%,超过 37000 个组织订阅了 Copilot 商业服务,付费用户已突破 100 万。Copilot 还新增了 Copilot Chat 功能,被多家知名企业使用,提高了软件开发人员的生产力。微软的 Bing 搜索引擎与 OpenAI 的 ChatGPT 集成,已经实现了超过 19 亿次聊天。微软的合作与投资估计将带来巨大的财务回报,有望创造高额价值。
◇ 斯坦福等提出新的 Transformer 替代技术 🔗 News
最近,斯坦福大学和纽约州立大学布法罗分校的一个研究团队发布了一篇论文,提出了一种名为 Monarch Mixer 的 Transformer 替代技术,并公开了一些检查点模型及训练代码。该方法通过使用富有表现力的 Monarch 矩阵,去掉了 Transformer 中高成本的注意力和 MLP,使得在语言和图像实验中以更低的成本取得了更好的表现。
- Paper: arxiv.org/abs/2310.12...
- Github: github.com/HazyResearc...
「 芯片领域 」
◇ 苹果史上最短发布会:3 纳米 M3 芯片亮相,可用于研发 AI 软件 🔗 News
苹果公司在"Scary Fast(快得吓人)"线上发布会上推出了基于 3 纳米技术的新款 M3 芯片系列,包括 M3、M3 PRO 和 M3 MAX,并发布了搭载这些芯片的新款笔记本电脑和 iMac。尽管此次发布会被誉为"史上最短苹果发布会",但 M3 芯片系列的性能显著提升,特别是在动态缓存、图形处理和 AI 软件开发等方面。发布会上还宣布了新 Mac 产品的价格和上市日期,但外界对此次更新反响褒贬不一,有网友认为内容可通过一封邮件传达。此次发布旨在提振苹果在 PC 市场的竞争力,并预期在即将到来的假日季提高销售额。
「 融资快讯 」
◇ 智谱 AI 推出 ChatGLM3:国内 大模型 竞争白热化,融资活跃持续 🔗 News
智谱 AI 在累计获得超 25 亿人民币融资后,发布了全自研的第三代基座大模型 ChatGLM3 及相关产品。自 2020 年底,该公司完成了五次产品升级,与腾讯、百度等国内大模型公司处于激烈竞争中。CEO 张鹏表示,ChatGLM3 在语义和逻辑能力上都有大幅度增强,支持复杂场景的应用。智谱 AI 的 GLM 模型在与国际巨头如 OpenAI、Google Brain 等的大模型比较中表现出色。此外,大模型领域的投资活动增加,但国内公司的融资额与美国仍存在差距。
「 早点趣玩 」
◇ 万兴科技发布 AI 视频创作软件 Filmora 13 🔗 News
万兴科技旗下的 AI 视频创作软件 Wondershare Filmora 13 全球发布,内置 AI 创作助手 Copilot,能够为用户提供智能化的创作建议和辅助。该软件不仅增加了 AI 文本成片、AI 音乐生成器等功能,还推出了 AI 文字快剪、智能人声分离等智能编辑功能。此外,Filmora 13 强化了云服务,并支持多端共享和同步。同时,面向国内市场的版本"万兴喵影 2024"也同步更新,加入了多种 AI 创作功能。这标志着视频创意软件在 AI 技术应用上的进一步深化。
「 技术阅读 」
◇ 使用形式化方法反馈微调语言模型 🔗 News
该论文提出了一个全自动方法,用于微调预训练的语言模型,以适应自主系统中的应用。虽然预训练的语言模型包含有助于规划和控制的通用知识,但它们可能无法为特定领域的任务生成合适的控制策略。现有的微调方法使用人类反馈来解决这个限制,但获取人类反馈既费时又昂贵。提出的方法使用自然语言任务描述来从预训练模型中合成基于自动机的控制器。这些控制器可以根据一个世界模型对独立提供的规范进行验证。遵循所需规范的控制器得到更高的排名,指导迭代的微调过程。论文主要在自动驾驶领域提供了定量证据,展示了该方法在多个任务中的有效性。结果表明,控制器满足规范的百分比从 60%提高到 90%。
- Paper: arxiv.org/abs/2310.18...