Deep Learning复习笔记0

Key Concept:

  • Embedding: learned dense, continuous, low-dimensional representations of object 【将难以表示的对象(如图片,文本等)用连续的低维度的方式表示】

  • RNN: Recurrent Neural Network -> for processing sequential data (time series data, natural language text, audio signals, images, videos, images, ...)【用于处理序列数据】

  • CNN: Convolutional Neural Network -> for processing grid data【用于处理网格数据】Grid data means neighboring points related 相邻点之间相关的

  • Attention: summarize multiple inputs, often focusing on a small, dynamic subset of the inputs【每次关注一个小地方】

  • GNNs: Graph Neural Networks -> for processing graph data【用于处理图数据】

  • Deep Generative Models -> use deep neural networks to define generative model for complex data distributions (e.g., text, audio, image, graphs, ...)【使用深度神经网络定义复杂数据分布(如文本、音频、图像、图形等)的生成模型涉及利用各种类型的生成模型】

  • Deep Learning Frameworks: PyTorch, TensorFlow, ...

  • Gradient-based parameter estimation【基于梯度的参数估计】

    1. Programmers specify model (e.g., implement forward pass)【通过实现前向传递来设置模型】
    2. When used on training data, framework collects operations and their outputs to build computation graph【在训练数据上使用时,框架收集操作及其输出以构建计算图】
    3. Gradient computation performed automatically from this computation graph using backpropagation【从这个计算图中自动执行梯度计算(使用反向传播算法)】
    4. Optimizer uses gradient to update model【优化器使用梯度来更新模型参数】

    Challenge: large, complex models; limited training data

Deep Learning复习笔记内容大纲

  • Feedforward neural networks
  • Backpropagation and parameter optimization
  • Machine learning systems
  • Training techniques for deep learning models
  • Recurrent neural networks
  • Convolutional neural networks
  • Attention and Transformers
  • Deep learning for graphs
  • Deep generative modelling
相关推荐
静心问道几秒前
SEW:无监督预训练在语音识别中的性能-效率权衡
人工智能·语音识别
xwz小王子7 分钟前
从LLM到WM:大语言模型如何进化成具身世界模型?
人工智能·语言模型·自然语言处理
我爱一条柴ya8 分钟前
【AI大模型】深入理解 Transformer 架构:自然语言处理的革命引擎
人工智能·ai·ai作画·ai编程·ai写作
静心问道9 分钟前
FLAN-T5:规模化指令微调的语言模型
人工智能·语言模型·自然语言处理
李师兄说大模型9 分钟前
KDD 2025 | 地理定位中的群体智能:一个多智能体大型视觉语言模型协同框架
人工智能·深度学习·机器学习·语言模型·自然语言处理·大模型·deepseek
静心问道10 分钟前
SqueezeBERT:计算机视觉能为自然语言处理在高效神经网络方面带来哪些启示?
人工智能·计算机视觉·自然语言处理
Sherlock Ma10 分钟前
百度开源文心一言4.5:论文解读和使用入门
人工智能·百度·自然语言处理·开源·大模型·文心一言·多模态
weisian15115 分钟前
人工智能-基础篇-18-什么是RAG(检索增强生成:知识库+向量化技术+大语言模型LLM整合的技术框架)
人工智能·语言模型·自然语言处理
DataCastle21 分钟前
第三届Bio-OS AI开源大赛启动会隆重举行
人工智能
后端小肥肠29 分钟前
躺赚必备!RPA+Coze+豆包:公众号自动发文,AI率0%亲测有效(附AI率0%提示词)
人工智能·aigc·coze