Transformer专栏开整

五一节前吹的牛,五一期间没完成,今天忙里偷闲,给完成了。

那就是初步拟定了一个《Transformer专栏》的写作大纲。

之前一直想写一系列Transformer架构的算法解析文章,但因为一直在忙(虽然不知道在忙啥),总是被耽搁。

今天终于算是启动了。

巧的是,下班路上刚手敲完大纲,晚上一个小伙伴来咨询学习LLM的事情,问我之前写的《AI视觉入门专栏》是否适合LLM的入门。

我就顺便给这位小伙伴安利了一下正在做的这个专栏,虽然还未开始写。

Transformer 专栏是什么?

Transformer架构相比很多小伙伴都不陌生了,说它是目前最火的AI模型架构也不为过。

现在很多主流的大语言模型,比如chatGPT都是基于该架构进行的模型设计,可以说Transformer顶起了AI的半壁江山。

本专栏主要就是要拆解Transformer架构的算法原理。

我会尽可能用通俗的大白话来讲清楚该架构的各种细节。

你可能在很多地方都看过该架构相关的算法解析文章,什么注意力机制啦、QKV矩阵啦等等。

对于这些有些枯燥的概念,有些乏味的数学表达,我会尽可能说的直白和通俗易懂,打通理解Transformer的最后一公里。

当然,为了说清楚其中的一些概念,我会在相关知识点处穿插大量的背景知识介绍。

本专栏也会介绍一些chatGPT模型用到的技术点。

相信本专栏能帮你彻底搞懂Transformer这个变形金刚。

如何阅读相关文章

有两种阅读渠道可以阅读到本专栏的文章:

第一,在我的公众号《董董灿是个攻城狮》进行阅读。点击这里查看详情

我会在本公众号进行文章的首发,相关文章会添加标签"Transformer专栏",可点击文章左下角的标签查看所有文章。

第二个阅读渠道:关注我的掘金账号。

相关文章会发布到《Transformer最后一公里》专栏中,如本篇文章就会加入到本专栏。

本专栏文章计划要写100篇左右的文章,希望自己可以坚持下去,也希望对此专栏感兴趣的小伙伴监督,努力更新下去。

最后

如果你对Transformer架构有独特的理解,诚挚的邀请你称为本专栏文章的合伙人,进行联合创作,你将获得与本专栏内容有关的收益分成。

相关推荐
使者大牙1 分钟前
【LLM学习笔记】第三篇:模型微调及LoRA介绍(附PyTorch实例)
人工智能·pytorch·python·深度学习
Elastic 中国社区官方博客9 分钟前
Elasticsearch 和 Kibana 8.16:Kibana 获得上下文和 BBQ 速度并节省开支!
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
陌上阳光9 分钟前
动手学深度学习69 BERT预训练
人工智能·深度学习·bert
车载诊断技术10 分钟前
电子电气架构--- 实施基于以太网的安全车载网络
网络·人工智能·安全·架构·汽车·电子电器架构
学步_技术42 分钟前
自动驾驶系列—自动驾驶车辆的姿态与定位:IMU数据在复杂环境中的关键作用
人工智能·自动驾驶·imu
开发者每周简报1 小时前
当微软windows的记事本被AI加持
人工智能·windows·microsoft
沉下心来学鲁班1 小时前
欺诈文本分类检测(十八):基于llama.cpp+CPU推理
人工智能·语言模型·分类·cpu·llama.cpp
新手小白勇闯新世界1 小时前
点云论文阅读-1-pointnet++
论文阅读·人工智能·深度学习·神经网络·计算机视觉
小菜日记^_^1 小时前
BEAGLE: Forensics of Deep Learning Backdoor Attack for Better Defense(论文阅读)
论文阅读·人工智能·深度学习·sp·ai安全·backdoor 后门攻击·安全四大
千天夜2 小时前
激活函数解析:神经网络背后的“驱动力”
人工智能·深度学习·神经网络