2025华为AI岗实习面试深度学习基础知识

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,可以得到分类的正确和错误情况:

通过设置不同的阈值,可以得到不同的分类结果和混淆矩阵

ROC曲线 (Receiver Operator Characteristic)

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率(灵敏度):

特异度

ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)

AUC越大的模型效果越好

PCA问题

各种分布的意义:

泊松分布 :描述单位时间/空间内某事件的发生次数

指数分布:连续时间下首次事件发生时间(连续)

二项分布:固定次数试验中成功次数

几何分布: 首次成功的试验次数 (离散)

指数分布和几何分布的区别:

各种attention的变体:MHA,GQA,MQA,MLA(DeepSeek-V2)

Multi-Head Attention (MHA)示意图:

Multi-head Latent Attention(MLA)示意图:

原论文中画的MLA的示意图:

具体计算方式:

其中的W^UK可以和W^UQ合并,W^UV和W^O可以合并

RMSNorm

RMSNorm (Root Mean Square Layer Normalization)是一种 归一化方法,属于 LayerNorm 的变体,主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm,尤其在 Transformer 系列中。

相关推荐
weisian1514 分钟前
基础篇--概念原理-2-参数是什么?——从原理到实战,一篇讲透
面试·职场和发展·模型参数·7b和70b·参数=规则,不是原始数据
墨北小七4 分钟前
从目标检测到行为识别:YOLO 模型微调实战
人工智能·深度学习·神经网络
Peter·Pan爱编程5 分钟前
第三篇:10 分钟上手:用自然语言生成一个全栈应用
人工智能·ai编程
薛定猫AI17 分钟前
【深度解析】从 Claude Jupiter 到 ARC-AGI 3:大模型发布信号、评测体系与多模型工程接入实践
人工智能·agi
刘一说21 分钟前
AI 热点资讯日报-2026-05-01
人工智能
threelab22 分钟前
Three.js 代码云效果 | 三维可视化 / AI 提示词
开发语言·javascript·人工智能
Java小生不才23 分钟前
Spring AI文生音
java·人工智能·spring
jinanwuhuaguo25 分钟前
(第二十八篇)OpenClaw成本与感知的奇点——从“Token封建制”到“全民养虾”的本体论地基
android·人工智能·kotlin·拓扑学·openclaw
byte轻骑兵29 分钟前
【HID】规范精讲[8]: 蓝牙HID核心之L2CAP层——无线人机交互的通信桥梁设计解析
人工智能·人机交互·蓝牙·键盘·hid