2025华为AI岗实习面试深度学习基础知识

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,可以得到分类的正确和错误情况:

通过设置不同的阈值,可以得到不同的分类结果和混淆矩阵

ROC曲线 (Receiver Operator Characteristic)

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率(灵敏度):

特异度

ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)

AUC越大的模型效果越好

PCA问题

各种分布的意义:

泊松分布 :描述单位时间/空间内某事件的发生次数

指数分布:连续时间下首次事件发生时间(连续)

二项分布:固定次数试验中成功次数

几何分布: 首次成功的试验次数 (离散)

指数分布和几何分布的区别:

各种attention的变体:MHA,GQA,MQA,MLA(DeepSeek-V2)

Multi-Head Attention (MHA)示意图:

Multi-head Latent Attention(MLA)示意图:

原论文中画的MLA的示意图:

具体计算方式:

其中的W^UK可以和W^UQ合并,W^UV和W^O可以合并

RMSNorm

RMSNorm (Root Mean Square Layer Normalization)是一种 归一化方法,属于 LayerNorm 的变体,主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm,尤其在 Transformer 系列中。

相关推荐
测试员周周2 分钟前
【Appium 系列】第18节-重试与容错 — 移动端测试的稳定性保障
人工智能·python·功能测试·ui·单元测试·appium·测试用例
灰灰勇闯IT22 分钟前
DeepSeek-R1 在 CANN 上的推理部署
pytorch·python·深度学习
l1t24 分钟前
Hy-MT2-1.8B总结的pgvector 0.8.2解决了并行HNSW索引构建漏洞
数据库·人工智能·postgresql
太华24 分钟前
学习AI Agent编程-第二天-LangGraph ReAct模式实现
人工智能
dayuOK630726 分钟前
从“爆款复刻”到“个性化创作”:AI辅助写作的技术挑战与演进方向
人工智能·职场和发展·自动化·新媒体运营·媒体
努力学习_小白35 分钟前
Inception V1——学习记录
pytorch·深度学习·inception v1
Raink老师35 分钟前
【AI面试临阵磨枪-58】AI 生成内容合规、版权、审核机制设计
人工智能·面试·职场和发展
lizhihai_9936 分钟前
股市学习心得-与英伟达核心 PCB 相关的八家关联企业
大数据·人工智能·学习
嗝o゚43 分钟前
昇腾CANN ops-nn 仓的 Activation 算子:不只是 ReLU
人工智能·cann·ops-nn
thubier(段新建)1 小时前
从需求到上线:需求→业务→架构→功能→实现 全链路落地方法论
人工智能·架构