论文阅读--深度学习基础文献

AlphaGo Zero

论文信息:Silver D, Schrittwieser J, Simonyan K, et al. Mastering the game of go without human knowledgeJ. nature, 2017, 550(7676): 354-359.

参考文章:
深入浅析AlphaGo Zero与深度强化学习
AlphaGo Zero论文解析

Attention is all you need

论文信息:Vaswani A, Shazeer N, Parmar N, et al. Attention is all you needC//Advances in neural information processing systems. 2017: 5998-6008.

参考文章:
Self-Attention和Transformer
Transformer论文逐段精读【论文精读】-- 李沐视频
白话机器学习-Encoder-Decoder框架

Transformer 抛弃了传统的 CNN 和 RNN,没用循环和卷积,整个网络使用了 Attention 机制组成。Transformer 由 Muiti-Attenion 和 Feed Forward Neural Network 组成。可以将时序信息完全做并行处理。

相关推荐
冬奇Lab6 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab6 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan8 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi10 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒11 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒12 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户16931761726612 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟12 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781413 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩13 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent