导 读INTRODUCTION

2月28日,哈尔滨工业大学举办了"大模型原理、技术与应用------从GPT到DeepSeek"主题讲座,邀请哈工大人工智能研究院副院长、计算学部赛尔实验室副主任车万翔教授作为主讲嘉宾,500余名师生代表现场听取报告,超5万人次线上直播观看。该讲座在哈尔滨工业大学B站视频号的播放量累计达14万,抖音平台点赞加收藏近40万。
讲座从自然语言处理的概念和发展历史出发,逐步深入,举GPT系列为例来讲解大模型的基本原理,引出如今炙手可热的DeepSeek-R1的技术细节,最后展望了人工智能发展的未来趋势。可谓干货满满。相信我,看完这个讲座,你会发现你对DeepSeek-R1模型的理解从未如此透彻!
如果感兴趣的话,根据下方提示可以自取哈。
点击下载 →哈工大:《大模型原理、技术与应用---从GPT到DeepSeek》
开启你的 DeepSeek 之旅吧!
以下是对这些核心内容的简要概述:

1.自然语言处理的概念和发展历史
语言是人类交流思想、表达情感最自然、最深刻、最方便的工具。人类历史上大部分知识都是以语言文字形式记载和流传的。语言不仅是人类有史以来最大的技术发明之一,也是继真核细胞之后最伟大的进化成就。

2.什么是自然语言处理?
自然语言处理(NLP)是指用计算机来理解和生成自然语言的各种理论和方法。NLP属于认知智能的范畴,是人类和动物的主要区别之一,需要更强的抽象和推理能力。

3.GPT的创新与挑战
GPT(Generative Pre-trained Transformer)是OpenAI在2018年提出的一个重要模型,它采用语言模型预训练任务,通过计算一个句子在语言中出现的概率或给定上文预测下一个词出现的概率,学到了知识、语义、推理和情感等方面的信息。
尽管GPT-3在多个任务上表现出色,但它也存在一些不足,如缺乏知识推理能力和可解释性。例如,在回答"烤箱和铅笔哪个更重?"这样的问题时,GPT-3可能会给出错误的答案。

4.ChatGPT的关键核心技术
为了解决这些问题,OpenAI在2022年推出了ChatGPT。ChatGPT的核心技术包括无监督学习、有监督学习和强化学习。通过这些技术,ChatGPT能够更好地遵循人类指令,生成多样化的结果,并在未见过的任务上表现出色。



5.DeepSeek-R1的突破
DeepSeek-R1是由中国研发的大型语言模型,它在性能上可与OpenAI的GPT模型媲美。DeepSeek-R1通过模仿人类推理过程,能够逐步生成响应,在解决科学问题时表现得更为出色。DeepSeek-R1的核心技术包括思维链(Chain-of-Thought, COT)和强化学习(RL),这些技术使得模型在推理任务上具有更高的准确性和泛化性。


6.未来发展方向
自然语言处理的发展正从面向自然语言的处理转变为基于自然语言的智能。未来,大模型的发展方向将包括智能体、具身智能、决策机、情感个性化、轻量化、价值观对齐等。同时,随着技术的进步,大模型将在医疗、航天等领域发挥更大的作用。
总之,大语言模型作为人工智能的基石,正在推动自然语言处理技术向更高层次的发展。从GPT到DeepSeek,我们看到了技术的不断进步和应用的不断拓展。未来,随着技术的进一步创新和应用,大模型将在更多领域展现出其巨大的潜力。

篇幅有限以上只是部分内容概览
来源:哈尔滨工业大学社会计算与交互机器人研究中心、赛尔实验室