2025华为AI岗实习面试深度学习基础知识

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,可以得到分类的正确和错误情况:

通过设置不同的阈值,可以得到不同的分类结果和混淆矩阵

ROC曲线 (Receiver Operator Characteristic)

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率(灵敏度):

特异度

ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)

AUC越大的模型效果越好

PCA问题

各种分布的意义:

泊松分布 :描述单位时间/空间内某事件的发生次数

指数分布:连续时间下首次事件发生时间(连续)

二项分布:固定次数试验中成功次数

几何分布: 首次成功的试验次数 (离散)

指数分布和几何分布的区别:

各种attention的变体:MHA,GQA,MQA,MLA(DeepSeek-V2)

Multi-Head Attention (MHA)示意图:

Multi-head Latent Attention(MLA)示意图:

原论文中画的MLA的示意图:

具体计算方式:

其中的W^UK可以和W^UQ合并,W^UV和W^O可以合并

RMSNorm

RMSNorm (Root Mean Square Layer Normalization)是一种 归一化方法,属于 LayerNorm 的变体,主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm,尤其在 Transformer 系列中。

相关推荐
ZK_H10 小时前
嵌入式c语言——关键字其6
c语言·开发语言·计算机网络·面试·职场和发展
星河耀银海10 小时前
远控体验分享:安全与实用性参考
人工智能·安全·微服务
企业架构师老王10 小时前
2026企业架构演进:科普Agent(龙虾)如何从“极客玩具”走向实在Agent规模化落地?
人工智能·ai·架构
GreenTea10 小时前
一文搞懂Harness Engineering与Meta-Harness
前端·人工智能·后端
鬼先生_sir10 小时前
Spring AI Alibaba 1.1.2.2 完整知识点库
人工智能·ai·agent·源码解析·springai
深念Y10 小时前
豆包AI能力集成方案:基于会话管理的API网关设计
人工智能
龙文浩_11 小时前
Attention Mechanism: From Theory to Code
人工智能·深度学习·神经网络·学习·自然语言处理
ulimate_11 小时前
八卡算力、三个Baseline算法(WALLOSS、pi0、DreamZero)
人工智能
深小乐11 小时前
AI 周刊【2026.04.06-04.12】:Anthropic 藏起最强模型、AI 社会矛盾激化、"欢乐马"登顶
人工智能
微臣愚钝11 小时前
prompt
人工智能·深度学习·prompt