人工智能(AI)-机器学习-深度学习-大语言模型LLM(chatgtp)

【一文读懂"大语言模型" - CSDN App】

国产大语言模型是指由中国公司或机构开发的大规模预训练语言模型。目前,国产大语言模型主要有以下几种:

中文GPT(GPT-3):由华为公司开发,是一个基于Transformer架构的预训练语言模型。它可以用于文本生成、对话系统等自然语言处理任务。

星环GPT(GPT-2):由北京星环科技开发,是一个基于Transformer架构的预训练语言模型。它具有较强的文本生成能力,可以用于聊天对话、文本摘要等任务。

天元GPT:由百度公司开发,是一个基于Transformer架构的预训练语言模型。它可以用于文本生成、机器翻译等自然语言处理任务。

云知声GPT:由云知声科技开发,是一个基于Transformer架构的预训练语言模型。它可以用于智能客服、智能助手等对话系统。

小牛翻译GPT:由小牛翻译公司开发,是一个基于Transformer架构的预训练语言模型。它主要用于机器翻译和文本生成任务。

相关推荐
Uzuki4 小时前
AI可解释性 II | Saliency Maps-based 归因方法(Attribution)论文导读(持续更新)
深度学习·机器学习·可解释性
蹦蹦跳跳真可爱5896 小时前
Python----机器学习(KNN:使用数学方法实现KNN)
人工智能·python·机器学习
云和数据.ChenGuang9 小时前
机器学习之回归算法
人工智能·机器学习·回归
代码骑士10 小时前
聚类(Clustering)基础知识2
机器学习·数据挖掘·聚类
深蓝学院10 小时前
闭环SOTA!北航DiffAD:基于扩散模型实现端到端自动驾驶「多任务闭环统一」
人工智能·机器学习·自动驾驶
仙人掌_lz10 小时前
机器学习ML极简指南
人工智能·python·算法·机器学习·面试·强化学习
zy_destiny12 小时前
【工业场景】用YOLOv12实现饮料类别识别
人工智能·python·深度学习·yolo·机器学习·计算机视觉·目标跟踪
Blossom.11818 小时前
量子计算与经典计算的融合与未来
人工智能·深度学习·机器学习·计算机视觉·量子计算
硅谷秋水18 小时前
MoLe-VLA:通过混合层实现的动态跳层视觉-语言-动作模型实现高效机器人操作
人工智能·深度学习·机器学习·计算机视觉·语言模型·机器人