哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法

导 读INTRODUCTION

2月28日,哈尔滨工业大学举办了"大模型原理、技术与应用------从GPT到DeepSeek"主题讲座,邀请哈工大人工智能研究院副院长、计算学部赛尔实验室副主任车万翔教授作为主讲嘉宾,500余名师生代表现场听取报告,超5万人次线上直播观看。该讲座在哈尔滨工业大学B站视频号的播放量累计达14万,抖音平台点赞加收藏近40万。

讲座从自然语言处理的概念和发展历史出发,逐步深入,举GPT系列为例来讲解大模型的基本原理,引出如今炙手可热的DeepSeek-R1的技术细节,最后展望了人工智能发展的未来趋势。可谓干货满满。相信我,看完这个讲座,你会发现你对DeepSeek-R1模型的理解从未如此透彻!

如果感兴趣的话,根据下方提示可以自取哈。

点击下载哈工大:《大模型原理、技术与应用---从GPT到DeepSeek》

开启你的 DeepSeek 之旅吧!

以下是对这些核心内容的简要概述:
1.自然语言处理的概念和发展历史

语言是人类交流思想、表达情感最自然、最深刻、最方便的工具。人类历史上大部分知识都是以语言文字形式记载和流传的。语言不仅是人类有史以来最大的技术发明之一,也是继真核细胞之后最伟大的进化成就。

2.什么是自然语言处理?

自然语言处理(NLP)是指用计算机来理解和生成自然语言的各种理论和方法。NLP属于认知智能的范畴,是人类和动物的主要区别之一,需要更强的抽象和推理能力。

3.GPT的创新与挑战

GPT(Generative Pre-trained Transformer)是OpenAI在2018年提出的一个重要模型,它采用语言模型预训练任务,通过计算一个句子在语言中出现的概率或给定上文预测下一个词出现的概率,学到了知识、语义、推理和情感等方面的信息。

尽管GPT-3在多个任务上表现出色,但它也存在一些不足,如缺乏知识推理能力和可解释性。例如,在回答"烤箱和铅笔哪个更重?"这样的问题时,GPT-3可能会给出错误的答案。

4.ChatGPT的关键核心技术

为了解决这些问题,OpenAI在2022年推出了ChatGPT。ChatGPT的核心技术包括无监督学习、有监督学习和强化学习。通过这些技术,ChatGPT能够更好地遵循人类指令,生成多样化的结果,并在未见过的任务上表现出色。

5.DeepSeek-R1的突破

DeepSeek-R1是由中国研发的大型语言模型,它在性能上可与OpenAI的GPT模型媲美。DeepSeek-R1通过模仿人类推理过程,能够逐步生成响应,在解决科学问题时表现得更为出色。DeepSeek-R1的核心技术包括思维链(Chain-of-Thought, COT)和强化学习(RL),这些技术使得模型在推理任务上具有更高的准确性和泛化性。

6.未来发展方向

自然语言处理的发展正从面向自然语言的处理转变为基于自然语言的智能。未来,大模型的发展方向将包括智能体、具身智能、决策机、情感个性化、轻量化、价值观对齐等。同时,随着技术的进步,大模型将在医疗、航天等领域发挥更大的作用。

总之,大语言模型作为人工智能的基石,正在推动自然语言处理技术向更高层次的发展。从GPT到DeepSeek,我们看到了技术的不断进步和应用的不断拓展。未来,随着技术的进一步创新和应用,大模型将在更多领域展现出其巨大的潜力。

篇幅有限以上只是部分内容概览

来源:哈尔滨工业大学社会计算与交互机器人研究中心、赛尔实验室

相关推荐
灵感__idea4 小时前
《AI工程》:为什么需要RAG和智能体?
aigc·openai·ai编程
冬奇Lab5 小时前
Workflow 系列(04):Multi-Agent 协调——编排器边界、并发控制与上下文隔离
人工智能·工作流引擎
冬奇Lab5 小时前
每日一个开源项目(第147篇):HyperGraphRAG - 用超图表示 N 元关系,RAG 的第三代范式
人工智能·开源·graphql
甲维斯6 小时前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
阿里云大数据AI技术8 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心8 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信8 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信8 小时前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能