人工智能(AI)-机器学习-深度学习-大语言模型LLM(chatgtp)

【一文读懂"大语言模型" - CSDN App】

国产大语言模型是指由中国公司或机构开发的大规模预训练语言模型。目前,国产大语言模型主要有以下几种:

中文GPT(GPT-3):由华为公司开发,是一个基于Transformer架构的预训练语言模型。它可以用于文本生成、对话系统等自然语言处理任务。

星环GPT(GPT-2):由北京星环科技开发,是一个基于Transformer架构的预训练语言模型。它具有较强的文本生成能力,可以用于聊天对话、文本摘要等任务。

天元GPT:由百度公司开发,是一个基于Transformer架构的预训练语言模型。它可以用于文本生成、机器翻译等自然语言处理任务。

云知声GPT:由云知声科技开发,是一个基于Transformer架构的预训练语言模型。它可以用于智能客服、智能助手等对话系统。

小牛翻译GPT:由小牛翻译公司开发,是一个基于Transformer架构的预训练语言模型。它主要用于机器翻译和文本生成任务。

相关推荐
renhongxia15 小时前
如何基于知识图谱进行故障原因、事故原因推理,需要用到哪些算法
人工智能·深度学习·算法·机器学习·自然语言处理·transformer·知识图谱
CV@CV6 小时前
2026自动驾驶商业化提速——从智驾平权到Robotaxi规模化落地
人工智能·机器学习·自动驾驶
小白|8 小时前
CANN在自动驾驶感知中的应用:构建低延迟、高可靠多传感器融合推理系统
人工智能·机器学习·自动驾驶
ringking1238 小时前
autoware-1:安装环境cuda/cudnn/tensorRT库函数的判断
人工智能·算法·机器学习
算法狗28 小时前
大模型面试题:混合精度训练的缺点是什么
人工智能·深度学习·机器学习·语言模型
聆风吟º8 小时前
CANN ops-math 应用指南:从零搭建高效、可复用的自定义 AI 计算组件
人工智能·机器学习·cann
小白|9 小时前
CANN与联邦学习融合:构建隐私安全的分布式AI推理与训练系统
人工智能·机器学习·自动驾驶
HyperAI超神经10 小时前
在线教程|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁
开发语言·人工智能·深度学习·神经网络·机器学习·ocr·创业创新
程序员清洒13 小时前
CANN模型剪枝:从敏感度感知到硬件稀疏加速的全链路压缩实战
算法·机器学习·剪枝
液态不合群13 小时前
推荐算法中的位置消偏,如何解决?
人工智能·机器学习·推荐算法