神经网络检测题

第一部分:基础概念

  1. 神经元模型

    请用数学公式描述一个人工神经元(感知机)的运算过程,并解释每个符号的含义。

  2. 激活函数

    为什么神经网络需要激活函数?列举3种常见的激活函数及其优缺点。

  3. 损失函数

    分类任务和回归任务常用的损失函数分别是什么?写出它们的数学形式。


第二部分:前向传播与反向传播

  1. 计算图

    假设有一个简单网络:输入层→全连接层(权重矩阵W,偏置b)→ReLU激活→输出层。给定输入x,请写出前向传播的公式。

  2. 链式法则

    反向传播中如何通过链式法则计算损失对权重W的梯度?以均方误差(MSE)损失为例说明。

  3. 梯度消失/爆炸

    梯度消失和梯度爆炸问题是如何产生的?举出一种缓解方法。


第三部分:网络架构

  1. CNN与全连接网络的区别

    卷积神经网络(CNN)为什么比全连接网络更适合图像任务?解释卷积核的作用。

  2. RNN与LSTM

    循环神经网络(RNN)的长期依赖问题是什么?LSTM如何通过门控机制解决这一问题?

  3. Transformer的革新

    Transformer模型为何在自然语言处理中取代了RNN?解释其核心机制(如自注意力)。


第四部分:训练与优化

  1. 过拟合与正则化

    什么是过拟合?列举3种防止过拟合的方法(如Dropout),并解释其中一种的原理。

  2. 优化器对比

    SGD、Momentum、Adam优化器的主要区别是什么?Adam为什么更受欢迎?

  3. Batch Normalization

    批归一化(BatchNorm)的作用是什么?它在训练和推理时的计算方式有何不同?


第五部分:进阶问题

  1. 注意力机制

    解释注意力机制的核心思想,并写出注意力权重的计算公式(如缩放点积注意力)。

  2. 迁移学习

    为什么迁移学习在小数据集上有效?以预训练的ImageNet模型为例说明。

  3. 生成对抗网络(GAN)

    GAN的生成器和判别器如何博弈?写出GAN的损失函数(minimax公式)。

相关推荐
keke105 分钟前
Java【10_1】用户注册登录(面向过程与面向对象)
java·python·intellij-idea
狂奔solar24 分钟前
Westlake-Omni 情感端音频生成式输出模型
人工智能
idkmn_25 分钟前
Daily AI 20250513 (集成学习及其与联邦学习的区别)
人工智能·神经网络·机器学习·集成学习
码农小嘉1 小时前
若依框架页面
学习
微刻时光1 小时前
影刀RPA网页自动化总结
运维·人工智能·python·低代码·自动化·rpa·影刀rpa
小新1101 小时前
微信小程序学习之轮播图swiper
学习·微信小程序·notepad++
三天不学习1 小时前
浅析AI大模型为何需要向量数据库?【入门基础】
数据库·人工智能·欧氏距离·向量数据库·余弦相似度
WenGyyyL1 小时前
研读论文——《用于3D工业异常检测的自监督特征自适应》
人工智能·python·深度学习·机器学习·计算机视觉·3d
AI视觉网奇1 小时前
3d关键点 可视化
开发语言·python·pygame
belldeep1 小时前
python:trimesh 用于 STL 文件解析和 3D 操作
python·3d·stl