ChatGLM vs ChatGPT

所有的NLP大模型 都是transformer结构

1.Mask attention 的策略不同
2.训练任务目标不同

国内大模型nb公司:百度、清华智谱

一、主流大模型

粉色:Encoder-only。

绿色:Encoder-Decoder,尽头智谱ChatGLM。

蓝色:Decoder-only,尽头OpenAI GPT4。

二、OpenAI与智谱发展时间线

三、ChatGLM

GLM支持国产GPU

轻量化部署

优势

四、搜索增强WebGPT vs WebGLM

WebGLM,整体思路:

1.网上搜索答案,并且进行过滤(提高相关性)。

2.使用大模型,将搜索的结果,reference进行汇总,输出答案(可以有多个)。

3.使用打分模型,计算各个答案的得分,返回最高得分。训练样本:人的点赞数。

五、图文理解 GPT-4V vs. CogVLM

六、文生图 DALL·E vs. CogView

DALL·E

CogView

用Beit编码图片

相关推荐
Agent产品评测局7 小时前
互联网行业自动化平台选型,运营全流程提效指南:2026企业级智能体架构与实战全解析
运维·人工智能·ai·chatgpt·架构·自动化
小真zzz12 小时前
搜极星:你的免费“AI内容验真器”
大数据·人工智能·ai·chatgpt·seo·geo
White-Legend12 小时前
codex gpt-5.4 日卡200刀
chatgpt
Agent产品评测局12 小时前
企业 IT 运维自动化落地,故障处理全流程实现方法:2026智能体驱动下的运维架构演进与实战解析
运维·人工智能·ai·chatgpt·架构·自动化
yumgpkpm1 天前
华为昇腾910B上用Kubernetes(K8s)部署LLM和用Docker部署LLM的区别
docker·chatgpt·容器·stable diffusion·kubernetes·llama·gpu算力
啦啦啦!2 天前
ChatGPT和Gemini的接入和封装
人工智能·ios·chatgpt
贺小涛2 天前
DeepSeek vs ChatGPT:技术架构深度解析与核心优势对比
chatgpt·架构
斯坦SteinY2 天前
Git Worktree + Claude Code同时开发多个功能
人工智能·chatgpt·prompt·aigc·claude·并行开发
正在走向自律2 天前
第二章-AIGC入门-AIGC工具全解析:技术控的效率神器,DeepSeek国产大模型的骄傲(8/36)
人工智能·chatgpt·aigc·可灵·deepseek·即梦·阿里通义千问
sinat_286945192 天前
harness engineering
人工智能·算法·chatgpt