神经网络检测题

第一部分:基础概念

  1. 神经元模型

    请用数学公式描述一个人工神经元(感知机)的运算过程,并解释每个符号的含义。

  2. 激活函数

    为什么神经网络需要激活函数?列举3种常见的激活函数及其优缺点。

  3. 损失函数

    分类任务和回归任务常用的损失函数分别是什么?写出它们的数学形式。


第二部分:前向传播与反向传播

  1. 计算图

    假设有一个简单网络:输入层→全连接层(权重矩阵W,偏置b)→ReLU激活→输出层。给定输入x,请写出前向传播的公式。

  2. 链式法则

    反向传播中如何通过链式法则计算损失对权重W的梯度?以均方误差(MSE)损失为例说明。

  3. 梯度消失/爆炸

    梯度消失和梯度爆炸问题是如何产生的?举出一种缓解方法。


第三部分:网络架构

  1. CNN与全连接网络的区别

    卷积神经网络(CNN)为什么比全连接网络更适合图像任务?解释卷积核的作用。

  2. RNN与LSTM

    循环神经网络(RNN)的长期依赖问题是什么?LSTM如何通过门控机制解决这一问题?

  3. Transformer的革新

    Transformer模型为何在自然语言处理中取代了RNN?解释其核心机制(如自注意力)。


第四部分:训练与优化

  1. 过拟合与正则化

    什么是过拟合?列举3种防止过拟合的方法(如Dropout),并解释其中一种的原理。

  2. 优化器对比

    SGD、Momentum、Adam优化器的主要区别是什么?Adam为什么更受欢迎?

  3. Batch Normalization

    批归一化(BatchNorm)的作用是什么?它在训练和推理时的计算方式有何不同?


第五部分:进阶问题

  1. 注意力机制

    解释注意力机制的核心思想,并写出注意力权重的计算公式(如缩放点积注意力)。

  2. 迁移学习

    为什么迁移学习在小数据集上有效?以预训练的ImageNet模型为例说明。

  3. 生成对抗网络(GAN)

    GAN的生成器和判别器如何博弈?写出GAN的损失函数(minimax公式)。

相关推荐
晚霞的不甘5 小时前
CANN 支持多模态大模型:Qwen-VL 与 LLaVA 的端侧部署实战
人工智能·神经网络·架构·开源·音视频
华玥作者11 小时前
[特殊字符] VitePress 对接 Algolia AI 问答(DocSearch + AI Search)完整实战(下)
前端·人工智能·ai
AAD5558889911 小时前
YOLO11-EfficientRepBiPAN载重汽车轮胎热成像检测与分类_3
人工智能·分类·数据挖掘
王建文go11 小时前
RAG(宠物健康AI)
人工智能·宠物·rag
巫婆理发22211 小时前
循环序列模型
深度学习·神经网络
ALINX技术博客11 小时前
【202601芯动态】全球 FPGA 异构热潮,ALINX 高性能异构新品预告
人工智能·fpga开发·gpu算力·fpga
易营宝11 小时前
多语言网站建设避坑指南:既要“数据同步”,又能“按市场个性化”,别踩这 5 个坑
大数据·人工智能
春日见11 小时前
vscode代码无法跳转
大数据·人工智能·深度学习·elasticsearch·搜索引擎
ASKED_201912 小时前
Langchain学习笔记一 -基础模块以及架构概览
笔记·学习·langchain
Drgfd12 小时前
真智能 vs 伪智能:天选 WE H7 Lite 用 AI 人脸识别 + 呼吸灯带,重新定义智能化充电桩
人工智能·智能充电桩·家用充电桩·充电桩推荐