sheng的学习笔记-【中文】【吴恩达课后测验】Course 2 - 改善深层神经网络 - 第三周测验

课程2_第3周_测验题

目录:目录

第一题

1.如果在大量的超参数中搜索最佳的参数值,那么应该尝试在网格中搜索而不是使用随机值,以便更系统的搜索,而不是依靠运气,请问这句话是正确的吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第二题

2.每个超参数如果设置得不好,都会对训练产生巨大的负面影响,因此所有的超参数都要调整好,请问这是正确的吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第三题

3.在超参数搜索过程中,你尝试只照顾一个模型(使用熊猫策略)还是一起训练大量的模型(鱼子酱策略)在很大程度上取决于:

A. 【  】是否使用批量(batch)或小批量优化(mini-batch optimization)

B. 【  】神经网络中局部最小值(鞍点)的存在性

C. 【  】在你能力范围内,你能够拥有多大的计算能力(注:就是高性能电脑和低性能电脑的区别)

D. 【  】需要调整的超参数的数量

答案:

C.【 √ 】在你能力范围内,你能够拥有多大的计算能力(注:就是高性能电脑和低性能电脑的区别)

第四题

4.如果您认为 β \beta β(动量超参数)介于0.9和0.99之间,那么推荐采用以下哪一种方法来对 β \beta β值进行取样?

A. 【  】

r = np.random.rand()

beta = r * 0.09 + 0.9

B. 【  】

r = np.random.rand()

beta = 1 - 10 ** ( - r - 1 )

C. 【  】

r = np.random.rand()

beta = 1 - 10 ** ( - r + 1 )

D. 【  】

r = np.random.rand()

beta = r * 0.9 + 0.09

答案:

B.【 √ 】

r = np.random.rand()

beta = 1 - 10 ** ( - r - 1 )

第五题

5.找到好的超参数的值是非常耗时的,所以通常情况下你应该在项目开始时做一次,并尝试找到非常好的超参数,这样你就不必再次重新调整它们。请问这正确吗?

A. 【  】对

B. 【  】不对

答案:

B.【 √ 】不对

第六题

6.在视频中介绍的批量标准化中,如果将其应用于神经网络的第l层,您应该对谁进行标准化?

A. 【  】 z [ l ] z^{[l]} z[l]

B. 【  】 W [ l ] W^{[l]} W[l]

C. 【  】 b [ l ] b^{[l]} b[l]

D. 【  】 b [ l ] b^{[l]} b[l]

答案:

A.【 √ 】 z [ l ] z^{[l]} z[l]

第七题

7.在标准化公式 z n o r m ( i ) = z ( i ) − μ σ 2 + ϵ z^{(i)}_{norm}=\frac{z^{(i)}-\mu}{\sqrt{\sigma^2+\epsilon}} znorm(i)=σ2+ϵ z(i)−μ,为什么要使用epsilon(ϵ)?

A. 【  】为了更准确地标准化

B. 【  】为了避免除零操作

C. 【  】为了加速收敛

D. 【  】防止 μ \mu μ太小

答案:

B.【 √ 】为了避免除零操作

第八题

8.批标准化中关于 γ \gamma γ和 β \beta β的以下哪些陈述是正确的?

A. 【  】对于每个层,有一个全局值 γ ∈ R \gamma \in \mathbb{R} γ∈R和一个全局值 β ∈ R \beta \in \mathbb{R} β∈R,适用于于该层中的所有隐藏单元。

B. 【  】 γ \gamma γ和 β \beta β是算法的超参数,我们通过随机采样进行调整

C. 【  】它们确定了给定层的线性变量 z [ l ] z^{[l]} z[l]的均值和方差

D. 【  】最佳值是 γ = σ 2 + ϵ , β = μ \gamma=\sqrt{\sigma^2+\epsilon},\beta=\mu γ=σ2+ϵ ,β=μ

E. 【  】它们可以用Adam、动量的梯度下降或RMSprop,而不仅仅是用梯度下降来学习

答案:

C.【 √ 】它们确定了给定层的线性变量 z [ l ] z^{[l]} z[l]的均值和方差

E.【 √ 】它们可以用Adam、动量的梯度下降或RMSprop,而不仅仅是用梯度下降来学习

第九题

9.在训练了具有批标准化的神经网络之后,在用新样本评估神经网络的时候,您应该:

A. 【  】如果你在256个例子的mini-batch上实现了批标准化,那么如果你要在一个测试例子上进行评估,你应该将这个例子重复256次,这样你就可以使用和训练时大小相同的mini-batch进行预测。

B. 【  】使用最新的mini-batch的 μ \mu μ和 σ 2 \sigma^2 σ2值来执行所需的标准化

C. 【  】跳过用 μ \mu μ和 σ 2 \sigma^2 σ2值标准化的步骤,因为一个例子不需要标准化

D. 【  】执行所需的标准化,使用在训练期间,通过指数加权平均值得出的 μ \mu μ和 σ 2 \sigma^2 σ2

答案:

D.【 √ 】执行所需的标准化,使用在训练期间,通过指数加权平均值得出的 μ \mu μ和 σ 2 \sigma^2 σ2

第十题

10.关于深度学习编程框架的这些陈述中,哪一个是正确的?(选出所有正确项)

A. 【  】即使一个项目目前是开源的,项目的良好管理有助于确保它即使在长期内仍然保持开放,而不是仅仅为了一个公司而关闭或修改。

B. 【  】通过编程框架,您可以使用比低级语言(如Python)更少的代码来编写深度学习算法。

C. 【  】深度学习编程框架的运行需要基于云的机器。

答案:

A.【 √ 】即使一个项目目前是开源的,项目的良好管理有助于确保它即使在长期内仍然保持开放,而不是仅仅为了一个公司而关闭或修改。

B.【 √ 】通过编程框架,您可以使用比低级语言(如Python)更少的代码来编写深度学习算法。

相关推荐
Blossom.1187 小时前
基于Embedding+图神经网络的开源软件供应链漏洞检测:从SBOM到自动修复的完整实践
人工智能·分布式·深度学习·神经网络·copilot·开源软件·embedding
V1ncent Chen7 小时前
机器是如何“洞察“世界的?:深度学习
人工智能·深度学习
rit84324998 小时前
基于MATLAB的BP神经网络手写数字识别
开发语言·神经网络·matlab
java1234_小锋9 小时前
Transformer 大语言模型(LLM)基石 - Transformer架构详解 - 掩码机制(Masked)原理介绍以及算法实现
深度学习·语言模型·transformer
李小星同志11 小时前
DPO,PPO,GRPO的学习
人工智能·深度学习·学习
范男12 小时前
Qwen3-VL + LLama-Factory进行针对Grounding任务LoRA微调
人工智能·深度学习·计算机视觉·transformer·llama
金融小师妹13 小时前
美联储议息夜:基于多智能体决策分歧模型的“鹰派降息”推演
人工智能·深度学习·1024程序员节
Study99614 小时前
科普专栏|大语言模型:理解与生成语言的人工智能
人工智能·深度学习·机器学习·大模型·agent·大模型微调·大模型应用开发
森诺Alyson15 小时前
前沿技术借鉴研讨-2025.12.9(胎儿面部异常检测/超声标准平面检测/宫内生长受限)
论文阅读·人工智能·经验分享·深度学习·论文笔记
Coding茶水间15 小时前
基于深度学习的遥感地面物体检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·计算机视觉