华为面试，机器学习深度学习知识点：

机器学习深度学习知识点：

机器学习一般有哪些分数，对于不同的任务：

分类任务：

准确率（Accuracy）：预测正确的样本数占总样本数的比例，公式为

Accuracy=

TP+TN+FP+FN

TP+TN

，其中

（真正例）、

（真反例）、

（假正例）、

（假反例）。

精确率（查准率，Precision）：在预测为正的样本中，真正为正的比例，

Precision=

TP+FP

。

召回率（查全率，Recall）：在实际为正的样本中，被正确预测为正的比例，

Recall=

TP+FN

。

F1 分数：综合精确率和召回率的指标，

F1=

Precision+Recall

2×Precision×Recall

。

回归任务：

均方误差（MSE，Mean Squared Error）：预测值与真实值之差的平方的平均值，

MSE=

∑

i=1

−

)

，其中

是真实值，

是预测值，

是样本数量。

平均绝对误差（MAE，Mean Absolute Error）：预测值与真实值之差的绝对值的平均值，

MAE=

∑

i=1

∣y

−

∣

。

决定系数（

，Coefficient of determination）：衡量模型对数据的拟合程度，

=1−

∑

i=1

−

)

∑

i=1

−

)

，其中

是真实值的均值。

讲讲几种损失函数：

交叉熵损失函数（Cross Entropy Loss）：常用于分类任务，衡量预测分布与真实分布之间的差异。对于二分类，

L=−[ylog(

)+(1−y)log(1−

)]

，其中

是真实标签（0 或 1），

是预测为正类的概率。对于多分类，

L=−∑

i=1

log(

)

，

是类别数，

是真实标签（one-hot 编码），

是预测属于第

类的概率。

均方误差损失函数（MSE）：如上述回归任务中提到，适用于回归问题，衡量预测值与真实值之间的平均平方误差。

铰链损失（Hinge Loss）：常用于支持向量机（SVM），对于二分类问题，

L=max(0,1−y⋅f(x))

，其中

是真实标签（+1 或 - 1），

f(x)

是模型的预测值。

正则化：

目的：防止过拟合，提高模型的泛化能力。

L1 正则化：在损失函数中加入参数的绝对值之和，即

L=L

+λ∑

∣w

∣

，

是原始损失函数，

是正则化参数，

是模型参数。L1 正则化会使部分参数变为 0，产生稀疏解，可用于特征选择。

L2 正则化（权重衰减，Weight Decay）：在损失函数中加入参数的平方和，

L=L

+λ∑

。L2 正则化使参数值趋于较小，避免参数过大导致过拟合。

了解 1*1 卷积吗？：

定义：是一种特殊的卷积操作，卷积核的大小为

1×1

。

作用：

降维和升维：在通道维度上进行操作，可以减少或增加特征图的通道数。例如，当输入特征图通道数较多时，通过

1×1

卷积可以降低通道数，减少计算量。

跨通道信息整合：可以在不改变特征图空间尺寸的情况下，对不同通道的信息进行线性组合，实现特征的融合。

增加网络深度：引入更多的非线性变换，提升网络的表达能力。

讲一下过拟合和欠拟合：

过拟合：模型在训练集上表现很好，但是在测试集或新数据上表现很差。原因是模型过于复杂，学习到了训练数据中的噪声和细节，而没有捕捉到数据的一般规律。例如，一个多项式回归模型，当多项式次数过高时，可能会过度拟合训练数据的波动。

欠拟合：模型在训练集和测试集上的表现都不好，不能很好地拟合数据。原因是模型过于简单，无法学习到数据中的复杂关系。例如，使用线性模型去拟合非线性的数据。

讲一讲 BN（Batch Normalization），以及在测试阶段 BN 如何处理：

BN 的作用：对神经网络的每一层输入进行归一化，加速网络的训练过程，缓解梯度消失和梯度爆炸问题，提高模型的泛化能力。

原理：在训练时，对于每个 mini-batch，计算输入的均值

和方差

，然后对输入

x
进行归一化，得到
x
^

+ϵ

x−μ

，其中

是一个很小的常数，防止分母为 0。之后再通过两个可学习的参数

和

进行缩放和平移，

y=γ

+β

。

测试阶段：使用训练阶段计算得到的均值和方差的移动平均值（一般是通过指数加权平均得到），而不是在测试数据上计算均值和方差。这样可以保证测试时的归一化操作是稳定的，并且与训练时的分布保持一致。

C++ 知识点：

32 位系统的指针占用多少内存：在 32 位系统中，指针占用 4 个字节（32 位）的内存，因为 32 位系统的地址总线是 32 位，可以表示的地址空间为

，所以指针需要 4 个字节来存储地址。

Python 知识点：

Python 的内存管理：

垃圾回收：Python 使用引用计数为主，标记 - 清除和分代回收为辅的垃圾回收机制。引用计数是指每个对象都有一个引用计数，当对象的引用计数为 0 时，该对象的内存会被释放。标记 - 清除用于处理循环引用的情况，分代回收将对象分为不同的代，根据对象的存活时间来进行不同频率的垃圾回收。

内存分配：Python 的内存分配由解释器管理，使用了内存池等技术来提高内存分配和释放的效率。例如，对于小对象（如整数、字符串等），会在内部的对象池中进行分配和复用。

手撕代码：

反转链表：

python

定义链表节点类

class ListNode:

def init (self, val=0, next=None):

self.val = val

self.next = next

def reverseList(head):

prev = None

current = head

while current:

next_node = current.next

current.next = prev

prev = current

current = next_node

return prev

二叉树的最大宽度 Leetcode 662：

python

定义二叉树节点类

class TreeNode:

def init (self, val=0, left=None, right=None):

self.val = val

self.left = left

self.right = right

def widthOfBinaryTree(root):

if not root:

return 0

queue = [(root, 0)]

max_width = 0

while queue:

level_start = queue[0][1]

level_end = queue[-1][1]

max_width = max(max_width, level_end - level_start + 1)

new_queue = []

for node, index in queue:

if node.left:

new_queue.append((node.left, 2 * index))

if node.right:

new_queue.append((node.right, 2 * index + 1))

queue = new_queue

return max_width

其他知识点：

数据增强的方法：
图像：加噪声（如高斯噪声、椒盐噪声等）、旋转（按一定角度旋转图像）、扭曲（如仿射变换、透视变换等）、平移（将图像在水平或垂直方向上移动）、裁剪（随机裁剪图像的一部分）、翻转（水平翻转或垂直翻转）等。
音频：时间拉伸（加速或者放慢音频）、Pitch shifting（改变音频的音调）、Dynamic Range Compression (DRC)（动态范围压缩）、Background Noise（添加背景噪声）等。
人脸识别的损失函数：
交叉熵损失函数：用于分类任务，将不同的人脸类别作为不同的类别进行分类。
三元组损失（Triplet Loss）：目的是使同一类人脸的特征向量距离尽可能近，不同类人脸的特征向量距离尽可能远。它通过构造三元组（锚点、正样本、负样本）来计算损失。
中心损失（Center Loss）：在交叉熵损失的基础上，引入类中心的概念，使每个类别的特征向量更加紧凑地聚集在其类中心周围。
Dropout 在测试阶段如何处理：在测试阶段，Dropout 通常会被关闭，即所有神经元都正常工作，不进行随机失活操作。为了保持训练和测试阶段的输出期望一致，在测试时，每个神经元的输出会乘以训练时的失活概率（例如，训练时失活概率为 0.5，则测试时每个神经元的输出乘以 0.5）。
为什么会出现梯度消失和梯度爆炸？：
梯度消失：在深度神经网络中，当使用反向传播算法计算梯度时，由于激活函数的导数小于 1，经过多层传播后，梯度会逐渐变小，导致靠近输入层的参数更新非常缓慢，甚至无法更新。例如，在使用 sigmoid 函数作为激活函数时，其导数在输入值较大或较小时接近于 0，容易引发梯度消失问题。
梯度爆炸：与梯度消失相反，当激活函数的导数大于 1，或者网络的权重初始化过大时，经过多层传播后，梯度会不断增大，导致参数更新过大，模型无法收敛。
介绍一下分数，比如查准率查全率 F1score：见前面机器学习分数部分的回答。
讲一下 softmax：
定义：常用于多分类问题，将一个
n
维的实数向量转换为一个概率分布。对于输入向量
z=[z
1

,z
2

,⋯,z
n

]
，其 softmax 输出为
y
i

∑

j=1

，其中

是第

个类别的概率，且

∑

i=1

。

作用：将输出值转换为概率形式，便于进行分类决策，例如选择概率最大的类别作为预测结果。

多线程和进程的关系：

进程：是操作系统分配资源的基本单位，每个进程都有自己独立的地址空间、内存、文件描述符等资源。进程之间的通信需要通过特定的机制（如管道、共享内存、套接字等）。

线程：是进程内的执行单元，共享进程的资源，如地址空间、内存等。线程之间的切换开销比进程小，通信也相对简单，可以直接访问共享变量。一个进程可以包含多个线程，多线程可以提高程序的并发性能。

Linux 文件权限管理：

文件权限：在 Linux 中，每个文件都有所有者（owner）、所属组（group）和其他用户（others）的权限设置。权限包括读（r）、写（w）、执行（x）三种，分别用数字 4、2、1 表示。例如，文件权限为

rwxr−xr−−

，则所有者具有读、写、执行权限（7），所属组具有读和执行权限（5），其他用户具有读权限（4）。

权限设置命令：chmod命令用于修改文件权限，可以使用数字表示法（如chmod 754 file）或符号表示法（如chmod u+x file，表示给所有者添加执行权限）。chown命令用于修改文件的所有者，chgrp命令用于修改文件的所属组。

C++ stl 有了解吗？：

STL（Standard Template Library）：是 C++ 标准库的重要组成部分，提供了一系列通用的模板类和函数，包括容器（如 vector、list、deque、set、map 等）、迭代器、算法（如 sort、find、for_each 等）和仿函数等。

容器：用于存储和管理数据，不同的容器有不同的特点和适用场景。例如，vector 是动态数组，支持随机访问，适合在尾部进行插入和删除操作；list 是双向链表，不支持随机访问，但在任意位置插入和删除元素的效率较高。

算法：是对容器中的数据进行操作的函数，如排序、查找、变换等。算法可以与不同的容器配合使用，提高代码的复用性和效率。

Numpy 的数组，pytorch tensor 有什么区别？：

数据类型：Numpy 数组主要用于处理数值型数据，支持多种数据类型（如 float、int 等）。PyTorch tensor 不仅可以处理数值型数据，还可以处理其他类型的数据，如布尔型、复数型等，并且在 GPU 上的计算效率更高。

计算设备：Numpy 数组只能在 CPU 上进行计算，而 PyTorch tensor 可以在 CPU 和 GPU 之间灵活切换，方便进行大规模的数值计算和深度学习任务。

自动求导：PyTorch tensor 具有自动求导功能，这是深度学习框架的重要特性，方便进行梯度计算和模型训练。Numpy 数组没有自动求导功能。

数组 reshape 之后内容是否一样？：如果在不改变数据的情况下进行 reshape 操作（即新的形状与原始数据的元素数量一致），那么 reshape 之后数组的内容是一样的，只是形状发生了变化。例如，将一个

2×3

的数组 reshape 为

3×2

，元素的值不会改变。

深拷贝浅拷贝：

浅拷贝：创建一个新的对象，但是新对象中的元素是对原对象中元素的引用。如果原对象中的元素是可变对象（如列表、字典等），那么修改新对象中的元素会影响原对象，反之亦然。例如，使用list.copy()方法进行浅拷贝。

深拷贝：创建一个新的对象，并且递归地复制原对象中的所有元素，新对象和原对象是完全独立的，修改新对象中的元素不会影响原对象。可以使用copy.deepcopy()函数进行深拷贝。

Python 装饰器：

定义：是一种特殊的函数，用于修改其他函数的行为。装饰器可以在不修改原函数代码的情况下，为函数添加额外的功能，如日志记录、性能测试、权限验证等。

实现方式：装饰器通常是一个函数，它接受一个函数作为参数，并返回一个新的函数。例如：

python

def decorator(func):

def wrapper():

print("Before function call")

func()

print("After function call")

return wrapper

@decorator

def my_function():

print("Inside my function")

my_function()

介绍一下深度学习框架 tensorflow pytorch：

TensorFlow：由 Google 开发和维护，是一个广泛使用的深度学习框架。它提供了丰富的工具和库，支持各种深度学习任务，如图像识别、自然语言处理等。TensorFlow 的计算图机制使得模型的定义和训练更加灵活，并且支持在 CPU、GPU 等多种设备上运行。它还提供了分布式训练的功能，适合大规模的深度学习应用。

PyTorch：由 Facebook 开发，是一个基于 Python 的深度学习框架。PyTorch 以其简洁易用的 API 和动态计算图而受到欢迎。动态计算图使得模型的调试和开发更加方便，同时也支持自动求导功能，方便进行模型训练。PyTorch 在学术界和工业界都有广泛的应用，特别是在自然语言处理和计算机视觉领域。