国内估值最高的大模型公司,“国产大模型五虎”系列之——智谱AI

前言:

上次我们介绍了同为"国产大模型五虎"的MiniMax,今天就继续来盘点一下国内估值最高的大模型企业智谱AI,同时也是五虎中的另外一虎。

"国产大模型五虎"指的是由阿里投资的五家大模型独角兽:智谱 AI、百川智能、月之暗面、零一万物和Minimax(排名不分先后)


我们先来简单的介绍一下智谱AI是一家什么样的大模型企业

智谱AI是一家源自清华大学计算机系技术成果的高科技公司

由张鹏作为CEO领军,核心成员多为清华大学等顶尖学府的学者

自2019年成立以来,一直致力于在认知智能领域拓宽人工智能技术的边界

公司的核心愿景是实现让机器具备类似人类的思考方式,向AGI的方向发展。

再来回顾一下智谱AI的发展时间线

2019年,依托清华大学的知识工程实验室,致力于端侧大模型技术,成立了智谱AI

2020年,智谱AI开始研发GLM预训练架构,并训练了百亿参数模型GLM-10B

2021年,公司利用MoE架构成功训练出万亿稀疏模型

2023年10月,完成超25亿元人民币融资,成为国内估值最高的大模型公司,超100亿人民币

目前,智谱AI的核心技术为端侧大模型

ChatGLM系列大模型基于GLM预训练架构,具备高性能、低延迟的特性,包括多个不同规模的版本,早起的产品有ChatGLM-6B、ChatGLM-10B等,截止到目前已经迭代了三款旗舰大模型,分别为:

ChatGLM2( 2023年6月

ChatGLM3( 2023年10月

GLM-4( 2024年1月16日

在中文能力的方面,GLM-4可以比肩ChatGPT-4。该模型在多个英文数据集上达到了GPT-4的90%至100%的水平,在中文对齐能力上甚至整体超过了GPT-4。

GLM-4可以支持128k的上下文窗口长度,单次提示词可以处理的文本长度相当于300页

且在"大海捞针"测试中,GLM-4模型在128K文本长度内能够实现几乎100%的精度召回

并且ChatGLM系列大模型集成了自研的AgentTuning技术,能够通过训练和调整模型,使其更好地适应特定任务的需求

另外,智谱AI还开发了文生图的大模型CogView

CogView模型采用了Transformer+VQVAE架构,这种架构的优势在于它能够同时学习模态间和模态内的多种关联性,从而提升图像与文本之间跨模态语义匹配的效果

其在MS COCO数据集上的表现超过了OpenAI的DALL·E

值得一提的是,CogView的代码已经在GitHub上开源了

目前,智谱AI开放了通用大模型等诸多主流大模型接口


下面我们就简单的从几个方面来测试一下他们最新的模型GLM-4,结果仅供参考哈

我问了一个这两天网上流行的新梗"成都迪士尼",结果与实际内容相差不二


再试一下数学计算能力

显而易见,在数学计算能力这块,还是答错了,不过数学计算能力一直是大模型需要攻克的难题,强如Claude3也会在这种问题上出错


继续让它帮我们写一篇题为:大模型浪潮来袭,普通人应如何把握机会的文章

这里我的要求是不分点,不少于800字,看看效果如何

通篇读下来,感觉中规中矩,顺序词用的太多了,且"此外","总之"重复出现,但是字数的要求达到了,整篇内容大约九百多字


总之,智谱AI作为国内估值最高的大模型公司,产品有自身的独特之处,研发了自主的大模型创新技术,单就这一点,就能够使其在众多的大模型公司中脱颖而出。实际的效果到底怎么样,还是需要大家自己体验才尚可得知。

相关推荐
Lethehong3 分钟前
CANN ops-nn仓库深度解读:AIGC时代的神经网络算子优化实践
人工智能·神经网络·aigc
那个村的李富贵5 分钟前
玩转CANN仓库:60行代码打造国产化AIGC商品标签智能生成器
aigc·cann
心疼你的一切6 分钟前
拆解 CANN 仓库:实现 AIGC 文本生成昇腾端部署
数据仓库·深度学习·aigc·cann
七月稻草人31 分钟前
CANN 生态下 ops-nn:AIGC 模型的神经网络计算基石
人工智能·神经网络·aigc·cann
不爱学英文的码字机器34 分钟前
GE:藏在CANN深处的“图编译大脑“,如何让AIGC模型快3倍?
aigc
不爱学英文的码字机器36 分钟前
解读CANN Models仓库:AIGC预训练模型的“兵工厂“
aigc
哈哈你是真的厉害1 小时前
CANN生态核心算子库合集:赋能AIGC多模态落地的全链路算力支撑
人工智能·aigc·cann
imbackneverdie1 小时前
2026国自然申请书模板大改版,科研人员如何应对?
人工智能·自然语言处理·aigc·科研·学术·国自然·国家自然科学基金
哈哈你是真的厉害1 小时前
驾驭万亿参数 MoE:深度剖析 CANN ops-transformer 算子库的“核武库”
人工智能·深度学习·aigc·transformer
秋邱1 小时前
DeepSeek 背后的“秘密武器”?高性能编程框架 PyPTO 深度解读
aigc