近日,上海和今信息科技有限公司(简称"和鲸科技")与北京智谱华章科技有限公司(简称"智谱AI")签订合作协议,双方将携手推动国产通用大模型的广泛应用与行业渗透,并积极赋能行业伙伴探索领域大模型的工程化落地,加速大模型技术的普及化进程。
大模型时代的兴起标志着人工智能迈向更高维度的认知,模型规模的快速增长将人工智能的应用和性能推向了前所未有的高度。发展大模型不仅拓展了机器学习的边界,也为各个领域解决实际问题提供了强有力的工具。2023 年见证了国内大模型的井喷式爆发,而作为早在 2022 年国内还没有多少人相信大模型的时候,就将高精度双语千亿模型 GLM-130B 进行了开源的智谱 AI ,无疑是受欢迎与令人期待的。
智谱 AI 官网首页(zhipuai.cn)
智谱 AI 致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型 GLM-130B ,并基于此推出对话模型 ChatGLM ,开源单卡版模型 ChatGLM-6B 。同时,团队还打造了 AIGC 模型及产品矩阵,包括 AI 提效助手智谱清言、高效率代码模型 CodeGeeX 、多模态理解模型 CogVLM 和文生图模型 CogView 等。公司践行 Model as a Service(MaaS)的市场理念,推出大模型 MaaS 开放平台,打造高效率、通用化的"模型即服务" AI 开发新范式。
值得一提的是,就在1月16日智谱 AI 技术开放日上,智谱 AI 发布了新一代基座大模型 GLM-4 ,性能比上一代提升接近 60% ,整体评测结果逼近 GPT-4 ,同时还推出了能够根据用户意图自动理解、规划复杂指令、自由调用 GLM 生态的 GLM-4 All Tools ,以及为所有开发者提供 AI 智能体定制能力的 GLMs 。
智谱开放日现场
作为国内大模型开源先锋,2023 年 3 月,智谱 AI 将 ChatGLM-6B------其重新训练的一个 60 亿参数的模型,进行了开源,一个月内在 Huggingface 的全球下载量便已超过 75 万;据智谱公开的数据显示,目前一代和二代的 ChatGLM-6B 模型已达到1000万+下载,累计四周 Hugging face 趋势榜第一,GitHub 5w+ stars。
同年 5 月,和鲸社区上线「ChatGLM 实践大赛 · 学术应用篇」,由智谱 AI 与和鲸科技联合国内最具影响力的学术平台 AMiner 举办,旨在最大化利用 ChatGLM-6B 助力学术、科研应用工具的开发工作。作为国内早期的 LLM 应用赛,大赛共吸引了数千余人参与,为有意投身 LLM 大规模语言模型研发的开发者与研究者们迈出第一步,提供了动力与激励,也为和鲸与智谱 AI 互为生态伙伴奠定了基础。
ChatGLM 赛道的颁奖合影
大赛中,和鲸科技自主研发的 ModelWhale 数据科学协同平台提供多方面支持,尤其在模型评价阶段彰显出卓越表现,其"自动化+轻量人工"的评审形式显著提升了 LLM 模型的评审公平性与评审效率;此外,ModelWhale 也在选手使用平台微调模型的过程中展现出了在参数调优和资源调度等方面的优越性。
ModelWhale 平台基于 ModelOps 理念,深度融合计算基础设施、模型开发环境与团队协同管理,打通数据、算力、模型、成果应用全流程,以"低门槛、即开即用"、"高协同、跨团队协作"、"高效率、模型研发应用显著提效"、"高性能、算力资源最大化使用"为特性,可为数据驱动型组织提供一站式数据分析与 AI 开发服务。迄今为止,来自气象、教育、医疗、航空航天、金融、通信、能源、零售等多个领域的行业头部机构与科研单位已使用 ModelWhale 开展大模型的构建与应用。
ModelWhale 平台全景与行业应用
"百模大战",垂直领域应用创新或成破局关键。随着和鲸科技与智谱 AI 达成战略合作,未来,双方将充分结合智谱 AI 基座大模型的技术实力与和鲸科技作为 AI 基础设施入口的平台能力及产业生态,向各领域行业伙伴提供更全面、自主开放的大模型解决方案,助力各行各业探索大模型在具体场景的应用,获得更广泛、深入的大模型实践体验,更好地理解、发挥大模型的潜力,并演化出更多高效、智能的行业模型,助力国产大模型在激烈的国际竞争中实现弯道超车!