2025华为AI岗实习面试深度学习基础知识

朴素贝叶斯分类器

朴素贝叶斯分类器认为样本的每个特征都是独立的

分类问题:混淆矩阵、F1、ROC和AUC

多分类问题的混淆矩阵:

对于根据老鼠体重来判断老鼠是否肥胖的二分类问题,使用罗辑回归的方式,并将阈值设置为0.5,高于这个阈值就认为老鼠肥胖

根据这个模型,可以得到分类的正确和错误情况:

通过设置不同的阈值,可以得到不同的分类结果和混淆矩阵

ROC曲线 (Receiver Operator Characteristic)

https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7https://www.bilibili.com/video/BV1CT4114799/?spm_id_from=333.337.search-card.all.click&vd_source=132c74f7a893f6ef64b723d9600c40b7

真阳性率(灵敏度):

特异度

ROC曲线中,越接近左上角,模型的效果越好

AUC (Area Under the Curve)

AUC越大的模型效果越好

PCA问题

各种分布的意义:

泊松分布 :描述单位时间/空间内某事件的发生次数

指数分布:连续时间下首次事件发生时间(连续)

二项分布:固定次数试验中成功次数

几何分布: 首次成功的试验次数 (离散)

指数分布和几何分布的区别:

各种attention的变体:MHA,GQA,MQA,MLA(DeepSeek-V2)

Multi-Head Attention (MHA)示意图:

Multi-head Latent Attention(MLA)示意图:

原论文中画的MLA的示意图:

具体计算方式:

其中的W^UK可以和W^UQ合并,W^UV和W^O可以合并

RMSNorm

RMSNorm (Root Mean Square Layer Normalization)是一种 归一化方法,属于 LayerNorm 的变体,主要用于神经网络训练中稳定梯度和加速收敛。它在某些大模型中替代标准 LayerNorm,尤其在 Transformer 系列中。

相关推荐
风象南4 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶4 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶4 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
罗西的思考7 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab8 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab8 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸9 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云9 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8659 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔10 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能