面试记录(三)

面了57min,实在问麻了,下面的问题就没有按顺序记录了:

1.linux熟悉吗:熟悉基础的环境变量、目录等用法,问如何查找一个文件(不会,又追问如何设计一个c的程序去查找:先找文件类型,再深度优先遍历)

2.代码的debug工具熟悉吗,怎么去修正bug------tensorboard,打印关键信息,查看变量信息

3.模型的调优或者优化------分布式训练,fp16代替fp32

4.stable diffusion的原理,diffusion能否用于检测用户的异常行为

5.传统机器学习算法了解多少------SVM

xgboost了解吗------了解一些,分类树的模型(下来一定好好学习)

6.transformer的encoder和decoder有什么区别(self和cross attention;mask矩阵)

7.特征选择和特征提取的方法(局部最优的贪心,遗传算法)

8.大模型能否用到这里(具体不是很了解)

9.大模型的微调方法------Lora(低秩分解,训练

10.核心业务关注:

玩过moba类游戏吗

最高段位怎么样

moba类游戏的外挂了解吗

以王者荣耀或者英雄联盟手游为例,怎么检测一个用户是否有开挂?

这里面试官其实每个阶段都会追问一些技术细节,就按照我设想的流程回答了:

(1)特征选取

关键是找到一些能够有助于判断开挂的行为:

局内的数据:分均经济、场均死亡次数、技能命中率(盲视野下)等

连续的行为:资源的抢夺率、防gank的行为(被抓的时候逃跑的反应速度)

总的来说应该有图像和序列的信息都能有帮助。

(2)特征筛选

看特征的量是否很大,小的话全局最优,大的话局部最优,同时判断一下特征的相关性,独立的要谨慎删除

局部最优的贪心,全局的遗传算法

(3)特征提取

图像数据:考虑实时性用convnext,不考虑的话上Vit

序列数据:Bert或者GPT(不是研究的领域,只听过这两个)

(4)多模态的融合

考虑三个层面的融合

1.输入端的融合------简单的编码后,concat

2.特征空间下的融合------不同的stage拼接(可以add,concat,cross-attention)

3.决策层面融合------bagging、boosting

(5)输出

一个分类任务

相关推荐
自由路飞2 分钟前
RAG 混合检索深挖:BM25 和向量分数为什么不能直接相加?
面试
未秃头的程序猿11 分钟前
告别"if-else地狱"!Java 21模式匹配,代码优雅了10倍
java·后端·面试
阳光是sunny11 小时前
Vue 项目怎么做用户行为全链路监控?轻量插件方案详解
前端·面试·架构
蝎子莱莱爱打怪12 小时前
DSpark 讲透:DeepSeek 不换模型,硬把 V4 提速 85%,是怎么做到的?
人工智能·面试·程序员
程序员七平1 天前
面试官:你说你Vibe Coding手拿把掐,那 Claude Code 用户级、项目级、本地级配置怎么隔离?
面试
葫芦和十三1 天前
图解 MongoDB 17|大集合与工作集:数据超过内存怎么办
后端·mongodb·面试
葫芦和十三1 天前
图解 MongoDB 18|复制集拓扑:Primary、Secondary 和 Arbiter 的分工
后端·mongodb·面试
葫芦和十三2 天前
图解 MongoDB 15|journal 与持久化:写入怎么不丢,崩溃怎么恢复
后端·mongodb·面试
葫芦和十三2 天前
图解 MongoDB 16|压缩:snappy、zstd 和 zlib 的取舍
后端·mongodb·面试
labixiong2 天前
实现一个能跑的迷你版Promise(一)
前端·javascript·面试