ChatGLM vs ChatGPT

所有的NLP大模型 都是transformer结构

1.Mask attention 的策略不同
2.训练任务目标不同

国内大模型nb公司:百度、清华智谱

一、主流大模型

粉色:Encoder-only。

绿色:Encoder-Decoder,尽头智谱ChatGLM。

蓝色:Decoder-only,尽头OpenAI GPT4。

二、OpenAI与智谱发展时间线

三、ChatGLM

GLM支持国产GPU

轻量化部署

优势

四、搜索增强WebGPT vs WebGLM

WebGLM,整体思路:

1.网上搜索答案,并且进行过滤(提高相关性)。

2.使用大模型,将搜索的结果,reference进行汇总,输出答案(可以有多个)。

3.使用打分模型,计算各个答案的得分,返回最高得分。训练样本:人的点赞数。

五、图文理解 GPT-4V vs. CogVLM

六、文生图 DALL·E vs. CogView

DALL·E

CogView

用Beit编码图片

相关推荐
hsjcjh1 小时前
2026年ChatGPT 5.4镜像站核心技术架构深度拆解与国内免费体验教程
chatgpt·架构
云天AI实战派2 小时前
ChatGPT/智能体异常输出排查指南:从哥布林输出到 API 跑偏的全流程修复手册
chatgpt
ZGi.ai6 小时前
AI工具泛滥的治理思路:从分散采购到统一底座
人工智能·chatgpt
Java.熵减码农6 小时前
长文拆解 Karpathy 的 AI 知识库搭建术(Obsidian + Claude Code 完整指南)
人工智能·chatgpt
hsjcjh9 小时前
多步推理引擎落地办公:用ChatGPT 5.4镜像站构建复杂文档的自动编织流水线(国内实测教程)
chatgpt
小超同学你好18 小时前
OpenClaw 深度解析系列 · 第8篇:Learning & Adaptation(学习与自适应)
人工智能·语言模型·chatgpt
马丁路的King1 天前
ChatGPT 不同档位的性价比
chatgpt
Jet45051 天前
玩转ChatGPT:Seedance 2.0制作宣传片(Clip 04-07)
chatgpt·seedance 2.0
YJlio1 天前
Windows Internals 读书笔记 10.3.3:Task Scheduler 架构详解
人工智能·windows·笔记·python·学习·chatgpt·架构
GEO索引未来1 天前
国内首部GEO可信传播标准立项通过/DeepSeek-V4 正式上线并开源/Open AI、Google继续推进AI广告标准化
大数据·人工智能·gpt·ai·chatgpt·开源