ChatGLM vs ChatGPT

所有的NLP大模型 都是transformer结构

1.Mask attention 的策略不同
2.训练任务目标不同

国内大模型nb公司:百度、清华智谱

一、主流大模型

粉色:Encoder-only。

绿色:Encoder-Decoder,尽头智谱ChatGLM。

蓝色:Decoder-only,尽头OpenAI GPT4。

二、OpenAI与智谱发展时间线

三、ChatGLM

GLM支持国产GPU

轻量化部署

优势

四、搜索增强WebGPT vs WebGLM

WebGLM,整体思路:

1.网上搜索答案,并且进行过滤(提高相关性)。

2.使用大模型,将搜索的结果,reference进行汇总,输出答案(可以有多个)。

3.使用打分模型,计算各个答案的得分,返回最高得分。训练样本:人的点赞数。

五、图文理解 GPT-4V vs. CogVLM

六、文生图 DALL·E vs. CogView

DALL·E

CogView

用Beit编码图片

相关推荐
It_张3 小时前
Building Systems with the ChatGPT API 使用 ChatGPT API 搭建系统(第五章学习笔记及总结)
笔记·学习·chatgpt
AI大模型3 小时前
AI老爱“瞎编”?给它请个RAG“私人秘书”,从此只说真话!
chatgpt·程序员·llm
清风徐来6751 天前
GPT-5 的 25 个隐藏神技,看完超过 90% 的人
chatgpt
GISer_Jing1 天前
旅行足迹App技术架构全解析
人工智能·chatgpt·架构
没有梦想的咸鱼185-1037-16631 天前
AI大模型支持下的:CMIP6数据分析与可视化、降尺度技术与气候变化的区域影响、极端气候分析
人工智能·python·深度学习·机器学习·chatgpt·数据挖掘·数据分析
sinat_286945192 天前
AI服务器介绍
服务器·人工智能·算法·chatgpt·transformer
RaymondZhao345 天前
【全面推导】策略梯度算法:公式、偏差方差与进化
人工智能·深度学习·算法·机器学习·chatgpt
lisuwen1165 天前
GPT-5 上线风波深度复盘:从口碑两极到策略调整,OpenAI 的变与不变
大数据·人工智能·gpt·chatgpt
lisuwen1167 天前
AI三国杀:马斯克炮轰苹果“偏袒”OpenAI,Grok与ChatGPT的应用商店战争揭秘
人工智能·chatgpt
暮小暮7 天前
从ChatGPT到智能助手:Agent智能体如何颠覆AI应用
人工智能·深度学习·神经网络·ai·语言模型·chatgpt