AI开发实习生面试总结(持续更新中...)

1.广州视宴(ai开发实习生)

首先是自我介绍~

1.第二个项目中的热力图是用怎么样的方式去做的?

2.在第二个项目中,如何用热力图去实现它的实时变化

答:我这里直接说我项目里面其实静态的热力图,不是动态的

3.如果要你爬虫阿里或者百度的网站,你会怎么做?阿里的做了什么样的反爬机制?

答:我首先说了下百度的反爬机制,后面我发现我没有反爬过阿里的网站,我直接说不会了,现在想来这两个应该是差不多的。

4.OpenCV如果识别人脸和人的身体的话,你会用什么库,比如说你要识别人的身体骨骼的话。

5.你的这个项目是识别人脸的,那你如何确保别人贴个照片在脸上直接过呢?怎么判断它是不是真人?

这个不会

6.transformer模型有没有了解过?

答:我说了一下它的大概结构和自注意力机制

7.现在有一个企业内部资料库,假如你需要把它训练成一个ai智能体,用于相互对话的话,你该怎么做?(我说用这个内部资料库对本地部署的deepSeek-R1模型进行训练,然后使用Pythoweb开发前后端进行交互,把训练后的结果利用网页来让它能够实现相互对话)

8.具体究竟是怎么训练这个智能体的?(我说调用科大讯飞的api进行情感分析和自然语言处理,然后生成结果)

9.那假如我就是不能用api,就是要离线生成答案,我应该怎么做?(这个也不是很会)

10.MCP协议了解过吗?(还真不会)

11.如果让你用OpenCV来用于做情感的识别,你会怎么做?。

答:我回答说OpenCV有一个专门的库是用来识别人脸的,还有几个库是专门识别像微笑,伤心等表情的

12.那如果我要增加它的表情类目的话呢,比如我要识别160种表情,我应该如何去做?

答:当时都傻了,160种表情?我后面直接说只用OpenCV的话是做不到的,我会像我写的第一个项目那样,在Kaggle上下载各个表情下的数据集,然后用YOLOv11的模型在配置好文件之后进行训练

13.那按你这样做的话,准确度能够控制在多少呢?

答:0.8-0.9吧

14.怎么提升这个准确度呢?

答:我回答要么训练次数更高一些,要么做数据增强

15.假如说这个表情识别的项目的受众群体是中国人比较多,但是数据集都是外国人,比如黑人和白人,这个会有什么影响?

答:我直接说由于黑人的嘴唇一般比我们国人要厚一点,可能我们的微笑在黑人那里会识别成假笑?

16.你一般用什么ai工具多一点?就只用过这些吗?

答:我说ChatGPT和deepSeek多一点,我还用过cursor里面的Gemini和Claude模型,只是ChatGPT和deepSeek用的多一点。

17.你觉得deepSeek这个模型是怎么做出来的?

答:我说是用ChatGPT的那个模型进行蒸馏,然后减少那个训练的数据集来降低成本

18.你需要什么样的条件你才能做出这种类型的模型出来。

答:我说好像是用要跟deepSeek差不多的一个训练环境,再模拟deepSeek的方法对ChatGPT进行一个蒸馏

19.假如说我要用deepSeek来让我的公众号实现像ai客服机器人一样去对话,我应该怎么做?

答:先利用爬虫的知识,在app上获取客户发送的消息。然后调用deepSeek的api来生成回答的文本,最后使用模拟器和selminum,DrissionPage这些自动化工具来模拟人的操作,将生成好的文本发送过去

20.那假如说企业有几十个微信账号,让它全都变成客户机器人呢?应该怎么做?

答:(这个我是真的不会了)下多几个模拟器进行类似的操作,或者使用网页版微信来增加它的那个ai客服的运行数据。

21.比如你那个电脑再使用这个自动化工具,我又不想让这个自动化工具影响我的日常微信的文件使用,我应该怎么做?

答:(这个其实我也不是很会)我说可以不用该脚本,可以想手机那样做应用双开?

22.那按你怎么做的话,跑这些模拟器的项目配置要多高?包括它这个链路该如何去串通起来?

这里有点答非所问了,我说了3080应该可以吧。

23.按你刚刚的那个配置对智能进行训练的话,大概要训练多久?

答:应该是一个星期吧。

24.你是明年毕业是吧,能够实习半年对吗?

答:是的。

反问环节~

总结:

这次面试让我深刻的意识到了自己的不足,对于这种场景题基本上是一点都不会,我的知识储备跟大佬们比肯定是不足的。我需要再好好的学习一些面试的题目。

写在最后:

我们可以在这里学习C++知识:

0voice · GitHub

相关推荐
钟屿5 分钟前
LIEDNet: A Lightweight Network for Low-light Enhancement and Deblurring论文阅读
论文阅读·图像处理·人工智能·深度学习
山顶望月川7 分钟前
集群、容器云与裸金属服务器的全面对比分析
人工智能·深度学习·机器学习
强盛小灵通专卖员12 分钟前
DL00912-基于自监督深度聚类的高光谱目标检测含数据集
人工智能·计算机视觉·目标跟踪
jerry60920 分钟前
LLM笔记(十)vLLM(1)PagedAttention论文笔记
论文阅读·人工智能·笔记·深度学习·学习·transformer
wswlqsss37 分钟前
第三十四天打卡
人工智能
拾忆-eleven1 小时前
NLP学习路线图(五):常用库-NumPy, Pandas, Matplotlib
python·自然语言处理·nlp
菲路普科技1 小时前
作业过程管控——看安全生产信息化平台全方位解决方案
大数据·人工智能
叫我黎大侠1 小时前
使用 LibreOffice 实现各种文档格式转换(支持任何开发语言调用 和 Linux + Windows 环境)[全网首发,保姆级教程,建议收藏]
java·大数据·linux·开发语言·python·c#·php
Icoolkj1 小时前
谷歌 NotebookLM 即将推出 Sparks 视频概览:Gemini 与 Deep Research 加持,可生成 1 - 3 分钟 AI 视频
人工智能·计算机视觉·音视频
xiaohanbao091 小时前
day34 python深度学习训练优化实践:CPU vs GPU
人工智能·python·深度学习·学习·机器学习