哈尔滨工业大学DeepSeek公开课：探索大模型原理、技术与应用从GPT到DeepSeek｜附视频与讲义免费下载方法

导读INTRODUCTION

2月28日，哈尔滨工业大学举办了"大模型原理、技术与应用------从GPT到DeepSeek"主题讲座，邀请哈工大人工智能研究院副院长、计算学部赛尔实验室副主任车万翔教授作为主讲嘉宾，讲座从自然语言处理的概念和发展历史出发，逐步深入，举GPT系列为例来讲解大模型的基本原理，引出如今炙手可热的DeepSeek-R1的技术细节，最后展望了人工智能发展的未来趋势。可谓干货满满。相信我，看完这个讲座，你会发现你对DeepSeek-R1模型的理解从未如此透彻！

如果感兴趣的话，根据下方提示可以自取哈。

点击下载 →哈工大:《大模型原理、技术与应用---从GPT到DeepSeek》

开启你的 DeepSeek 之旅吧！

以下是对这些核心内容的简要概述：

一、自然语言处理的概念和发展历史

语言是人类交流思想、表达情感最自然、最深刻、最方便的工具。自然语言处理（Natural Language Processing，NLP）指的是用计算机来理解和生成自然语言的各种理论和方法，需要更强的抽象和推理能力。随着技术的发展，自然语言处理成为制约人工智能取得更大突破和更广泛应用的瓶颈。

二、GPT系列模型

GPT(Generative Pre-trained Transformer)是OpenAI在2018年公布的预训练模型，采用语言模型预训练任务，实现了三大创新：使用建模能力更强的 Transformer 模型、在目标任务上精调整个预训练模型、接入的下游任务模型可以非常简单。2020年，OpenAI联合微软推出GPT-3，该模型达到了1750亿参数，无需训练，便可完成"文本"生成任务。但并不能克服深度学习模型鲁棒性差、可解释性弱、推理缺失的瓶颈，在深层次语义理解上与人类认知水平还相去较远。

2022年11月，ChatGPT的推出，初步给出了解决方案。ChatGPT有三大关键的核心技术：无监督学习、有监督学习和强化学习。