神经网络检测题

第一部分:基础概念

  1. 神经元模型

    请用数学公式描述一个人工神经元(感知机)的运算过程,并解释每个符号的含义。

  2. 激活函数

    为什么神经网络需要激活函数?列举3种常见的激活函数及其优缺点。

  3. 损失函数

    分类任务和回归任务常用的损失函数分别是什么?写出它们的数学形式。


第二部分:前向传播与反向传播

  1. 计算图

    假设有一个简单网络:输入层→全连接层(权重矩阵W,偏置b)→ReLU激活→输出层。给定输入x,请写出前向传播的公式。

  2. 链式法则

    反向传播中如何通过链式法则计算损失对权重W的梯度?以均方误差(MSE)损失为例说明。

  3. 梯度消失/爆炸

    梯度消失和梯度爆炸问题是如何产生的?举出一种缓解方法。


第三部分:网络架构

  1. CNN与全连接网络的区别

    卷积神经网络(CNN)为什么比全连接网络更适合图像任务?解释卷积核的作用。

  2. RNN与LSTM

    循环神经网络(RNN)的长期依赖问题是什么?LSTM如何通过门控机制解决这一问题?

  3. Transformer的革新

    Transformer模型为何在自然语言处理中取代了RNN?解释其核心机制(如自注意力)。


第四部分:训练与优化

  1. 过拟合与正则化

    什么是过拟合?列举3种防止过拟合的方法(如Dropout),并解释其中一种的原理。

  2. 优化器对比

    SGD、Momentum、Adam优化器的主要区别是什么?Adam为什么更受欢迎?

  3. Batch Normalization

    批归一化(BatchNorm)的作用是什么?它在训练和推理时的计算方式有何不同?


第五部分:进阶问题

  1. 注意力机制

    解释注意力机制的核心思想,并写出注意力权重的计算公式(如缩放点积注意力)。

  2. 迁移学习

    为什么迁移学习在小数据集上有效?以预训练的ImageNet模型为例说明。

  3. 生成对抗网络(GAN)

    GAN的生成器和判别器如何博弈?写出GAN的损失函数(minimax公式)。

相关推荐
DKPT3 小时前
Java桥接模式实现方式与测试方法
java·笔记·学习·设计模式·桥接模式
子燕若水4 小时前
Unreal Engine 5中的AI知识
人工智能
极限实验室5 小时前
Coco AI 实战(一):Coco Server Linux 平台部署
人工智能
杨过过儿5 小时前
【学习笔记】4.1 什么是 LLM
人工智能
巴伦是只猫5 小时前
【机器学习笔记Ⅰ】13 正则化代价函数
人工智能·笔记·机器学习
伍哥的传说5 小时前
React 各颜色转换方法、颜色值换算工具HEX、RGB/RGBA、HSL/HSLA、HSV、CMYK
深度学习·神经网络·react.js
大千AI助手5 小时前
DTW模版匹配:弹性对齐的时间序列相似度度量算法
人工智能·算法·机器学习·数据挖掘·模版匹配·dtw模版匹配
AI生存日记5 小时前
百度文心大模型 4.5 系列全面开源 英特尔同步支持端侧部署
人工智能·百度·开源·open ai大模型
LCG元6 小时前
自动驾驶感知模块的多模态数据融合:时序同步与空间对齐的框架解析
人工智能·机器学习·自动驾驶