2025华为AI岗实习面试深度学习基础知识

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,可以得到分类的正确和错误情况:

通过设置不同的阈值,可以得到不同的分类结果和混淆矩阵

ROC曲线 (Receiver Operator Characteristic)

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率(灵敏度):

特异度

ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)

AUC越大的模型效果越好

PCA问题

各种分布的意义:

泊松分布 :描述单位时间/空间内某事件的发生次数

指数分布:连续时间下首次事件发生时间(连续)

二项分布:固定次数试验中成功次数

几何分布: 首次成功的试验次数 (离散)

指数分布和几何分布的区别:

各种attention的变体:MHA,GQA,MQA,MLA(DeepSeek-V2)

Multi-Head Attention (MHA)示意图:

Multi-head Latent Attention(MLA)示意图:

原论文中画的MLA的示意图:

具体计算方式:

其中的W^UK可以和W^UQ合并,W^UV和W^O可以合并

RMSNorm

RMSNorm (Root Mean Square Layer Normalization)是一种 归一化方法,属于 LayerNorm 的变体,主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm,尤其在 Transformer 系列中。

相关推荐
Blossom.11831 分钟前
基于扩散模型的视频生成优化:从Stable Diffusion到AnimateDiff的显存革命
人工智能·深度学习·学习·决策树·搜索引擎·stable diffusion·音视频
黑客思维者32 分钟前
重塑信任与效率:Salesforce Einstein GPT 客服体系深度案例研究
人工智能·gpt·llm·客服系统·salesforce
jkyy201433 分钟前
从驾驶安全到健康管理—汽车座舱的健康数字化变革
大数据·人工智能·物联网·健康医疗
小股虫38 分钟前
SillyTavern使用本地大模型写故事实操手册
人工智能·ai写作·ollama·本地大模型·sillytavern
说私域39 分钟前
MarTech在客户运营中的作用:以开源AI大模型AI智能名片S2B2C商城小程序为例
人工智能·小程序·开源
一个处女座的程序猿40 分钟前
AI之Algorithms:TheAlgorithms_Python(所有用 Python 实现的算法)的简介、安装和使用方法、案例应用之详细攻略
人工智能·python·算法
西猫雷婶41 分钟前
CNN计算|原始矩阵扩充后的多维度卷积核计算效果
人工智能·pytorch·深度学习·神经网络·机器学习·矩阵·cnn