2025华为AI岗实习面试深度学习基础知识

Aspect of twilight2025-12-03 8:49

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题：混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵：

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题，使用罗辑回归的方式，并将阈值设置为0.5，高于这个阈值就认为老鼠肥胖

根据这个模型，可以得到分类的正确和错误情况：

通过设置不同的阈值，可以得到不同的分类结果和混淆矩阵

ROC曲线（Receiver Operator Characteristic）

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率（灵敏度）：

特异度

ROC曲线中，越接近左上角，模型的效果越好

AUC （Area Under the Curve）

AUC越大的模型效果越好

PCA问题

各种分布的意义：

泊松分布 ：描述单位时间/空间内某事件的发生次数

指数分布：连续时间下首次事件发生时间（连续）

二项分布：固定次数试验中成功次数

几何分布： 首次成功的试验次数（离散）

指数分布和几何分布的区别：

各种attention的变体：MHA，GQA，MQA，MLA（DeepSeek-V2）

Multi-Head Attention (MHA)示意图：

Multi-head Latent Attention（MLA）示意图：

原论文中画的MLA的示意图：

具体计算方式：

其中的W^UK可以和W^UQ合并，W^UV和W^O可以合并

RMSNorm

RMSNorm （Root Mean Square Layer Normalization）是一种 归一化方法，属于 LayerNorm 的变体，主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm，尤其在 Transformer 系列中。

上一篇：Hive 统计信息自动收集机制深度解析

下一篇：study in Dev-c++（string insert基本用法）（2025.12.2）

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06OpenClaw优化飞书API 额度已耗尽问题 07小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09Window 10部署openclaw报错node.exe : npm error code 128 10OpenClaw大龙虾机器人完整安装教程