哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法

导 读INTRODUCTION

2月28日,哈尔滨工业大学举办了"大模型原理、技术与应用------从GPT到DeepSeek"主题讲座,邀请哈工大人工智能研究院副院长、计算学部赛尔实验室副主任车万翔教授作为主讲嘉宾,500余名师生代表现场听取报告,超5万人次线上直播观看。该讲座在哈尔滨工业大学B站视频号的播放量累计达14万,抖音平台点赞加收藏近40万。

讲座从自然语言处理的概念和发展历史出发,逐步深入,举GPT系列为例来讲解大模型的基本原理,引出如今炙手可热的DeepSeek-R1的技术细节,最后展望了人工智能发展的未来趋势。可谓干货满满。相信我,看完这个讲座,你会发现你对DeepSeek-R1模型的理解从未如此透彻!

如果感兴趣的话,根据下方提示可以自取哈。

点击下载哈工大:《大模型原理、技术与应用---从GPT到DeepSeek》

开启你的 DeepSeek 之旅吧!

以下是对这些核心内容的简要概述:
1.自然语言处理的概念和发展历史

语言是人类交流思想、表达情感最自然、最深刻、最方便的工具。人类历史上大部分知识都是以语言文字形式记载和流传的。语言不仅是人类有史以来最大的技术发明之一,也是继真核细胞之后最伟大的进化成就。

2.什么是自然语言处理?

自然语言处理(NLP)是指用计算机来理解和生成自然语言的各种理论和方法。NLP属于认知智能的范畴,是人类和动物的主要区别之一,需要更强的抽象和推理能力。

3.GPT的创新与挑战

GPT(Generative Pre-trained Transformer)是OpenAI在2018年提出的一个重要模型,它采用语言模型预训练任务,通过计算一个句子在语言中出现的概率或给定上文预测下一个词出现的概率,学到了知识、语义、推理和情感等方面的信息。

尽管GPT-3在多个任务上表现出色,但它也存在一些不足,如缺乏知识推理能力和可解释性。例如,在回答"烤箱和铅笔哪个更重?"这样的问题时,GPT-3可能会给出错误的答案。

4.ChatGPT的关键核心技术

为了解决这些问题,OpenAI在2022年推出了ChatGPT。ChatGPT的核心技术包括无监督学习、有监督学习和强化学习。通过这些技术,ChatGPT能够更好地遵循人类指令,生成多样化的结果,并在未见过的任务上表现出色。

5.DeepSeek-R1的突破

DeepSeek-R1是由中国研发的大型语言模型,它在性能上可与OpenAI的GPT模型媲美。DeepSeek-R1通过模仿人类推理过程,能够逐步生成响应,在解决科学问题时表现得更为出色。DeepSeek-R1的核心技术包括思维链(Chain-of-Thought, COT)和强化学习(RL),这些技术使得模型在推理任务上具有更高的准确性和泛化性。

6.未来发展方向

自然语言处理的发展正从面向自然语言的处理转变为基于自然语言的智能。未来,大模型的发展方向将包括智能体、具身智能、决策机、情感个性化、轻量化、价值观对齐等。同时,随着技术的进步,大模型将在医疗、航天等领域发挥更大的作用。

总之,大语言模型作为人工智能的基石,正在推动自然语言处理技术向更高层次的发展。从GPT到DeepSeek,我们看到了技术的不断进步和应用的不断拓展。未来,随着技术的进一步创新和应用,大模型将在更多领域展现出其巨大的潜力。

篇幅有限以上只是部分内容概览

来源:哈尔滨工业大学社会计算与交互机器人研究中心、赛尔实验室

相关推荐
信创DevOps先锋几秒前
开源中国全栈式AI教育解决方案亮相 破解高校科研与人才培养双重痛点
人工智能·开源
Shadow(⊙o⊙)2 分钟前
static与extern使用
c语言·学习
QQ676580084 分钟前
城市治理之河道污染识别 无人机河道污染巡检 塑料带识别 瓶子图像识别 深度学习垃圾识别第10384期
人工智能·深度学习·yolo·河道污染·无人机河道污染·瓶子图像·塑料袋识别
风象南4 分钟前
当技术解决了一切“怎么做”,人类还剩下什么?
人工智能
老纪的技术唠嗑局8 分钟前
告别OpenClaw配置丢失——Mindkeeper内测版邀测
大数据·elasticsearch·搜索引擎
skilllite作者9 分钟前
SkillLite 多入口架构实战:CLI / Python SDK / MCP / Desktop / Swarm 一页理清
开发语言·人工智能·python·安全·架构·rust·agentskills
2501_9333295510 分钟前
技术深度剖析:Infoseek 字节探索舆情处置系统的全链路架构与核心实现
大数据·数据仓库·人工智能·自然语言处理·架构
网安情报局11 分钟前
RSAC 2026深度解析:AI对抗AI成主流,九大安全能力全面升级
人工智能·网络安全
key_3_feng11 分钟前
揭秘AI的“语言积木“:Token科普之旅
人工智能·搜索引擎·token
代码丰12 分钟前
Zero Code Studio:LangChain4j 工具调用 + LangGraph4j 工作流双模式的 AI 网站生成系统
java·人工智能