ChatGLM vs ChatGPT

所有的NLP大模型 都是transformer结构

1.Mask attention 的策略不同
2.训练任务目标不同

国内大模型nb公司:百度、清华智谱

一、主流大模型

粉色:Encoder-only。

绿色:Encoder-Decoder,尽头智谱ChatGLM。

蓝色:Decoder-only,尽头OpenAI GPT4。

二、OpenAI与智谱发展时间线

三、ChatGLM

GLM支持国产GPU

轻量化部署

优势

四、搜索增强WebGPT vs WebGLM

WebGLM,整体思路:

1.网上搜索答案,并且进行过滤(提高相关性)。

2.使用大模型,将搜索的结果,reference进行汇总,输出答案(可以有多个)。

3.使用打分模型,计算各个答案的得分,返回最高得分。训练样本:人的点赞数。

五、图文理解 GPT-4V vs. CogVLM

六、文生图 DALL·E vs. CogView

DALL·E

CogView

用Beit编码图片

相关推荐
马拉AI5 小时前
Andrej Karpathy 发布新项目 nanochat:一个从零开始构建的极简全栈式 ChatGPT 克隆
chatgpt
神码小Z15 小时前
特斯拉前AI总监开源的一款“小型本地版ChatGPT”,普通家用电脑就能运行!
人工智能·chatgpt
mit6.82417 小时前
[tile-lang] 张量核心 | 传统MMA->WGMMA | 底层自动选择优化
人工智能·chatgpt
AI拉呱_19 小时前
第144期《2025年AI现状报告》解读(二):产业篇
人工智能·chatgpt
哪吒编程2 天前
谁是最强编程大模型?横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro
gpt·chatgpt·claude
许泽宇的技术分享2 天前
百刀打造ChatGPT:nanochat极简LLM全栈实现深度解析
chatgpt·transformer·大语言模型·nanochat
算家计算2 天前
AI大神100美元手搓ChatGPT!nanochat教程爆火,4小时炼成聊天机器人
人工智能·chatgpt·资讯
陈敬雷-充电了么-CEO兼CTO4 天前
DeepSeek vs ChatGPT 技术架构、成本与场景全解析
人工智能·chatgpt·架构
siliconstorm.ai5 天前
阿里下场造“机器人”:从通义千问到具身智能,中国AI正走向“实体化”阶段
人工智能·自然语言处理·chatgpt·机器人·云计算
聚客AI5 天前
系统提示的“消亡”?上下文工程正在重新定义人机交互规则
图像处理·人工智能·pytorch·语言模型·自然语言处理·chatgpt·gpt-3