AI开发实习生面试总结（持续更新中...）

1.广州视宴（ai开发实习生）

首先是自我介绍~

1.第二个项目中的热力图是用怎么样的方式去做的？

2.在第二个项目中，如何用热力图去实现它的实时变化

答：我这里直接说我项目里面其实静态的热力图，不是动态的

3.如果要你爬虫阿里或者百度的网站，你会怎么做？阿里的做了什么样的反爬机制？

答：我首先说了下百度的反爬机制，后面我发现我没有反爬过阿里的网站，我直接说不会了，现在想来这两个应该是差不多的。

4.OpenCV如果识别人脸和人的身体的话，你会用什么库，比如说你要识别人的身体骨骼的话。

5.你的这个项目是识别人脸的，那你如何确保别人贴个照片在脸上直接过呢？怎么判断它是不是真人？

这个不会

6.transformer模型有没有了解过？

答：我说了一下它的大概结构和自注意力机制

7.现在有一个企业内部资料库，假如你需要把它训练成一个ai智能体，用于相互对话的话，你该怎么做？（我说用这个内部资料库对本地部署的deepSeek-R1模型进行训练，然后使用Pythoweb开发前后端进行交互，把训练后的结果利用网页来让它能够实现相互对话）

8.具体究竟是怎么训练这个智能体的？（我说调用科大讯飞的api进行情感分析和自然语言处理，然后生成结果）

9.那假如我就是不能用api，就是要离线生成答案，我应该怎么做？（这个也不是很会）

10.MCP协议了解过吗？（还真不会）

11.如果让你用OpenCV来用于做情感的识别，你会怎么做？。

答：我回答说OpenCV有一个专门的库是用来识别人脸的，还有几个库是专门识别像微笑，伤心等表情的

12.那如果我要增加它的表情类目的话呢，比如我要识别160种表情，我应该如何去做？

答：当时都傻了，160种表情？我后面直接说只用OpenCV的话是做不到的，我会像我写的第一个项目那样，在Kaggle上下载各个表情下的数据集，然后用YOLOv11的模型在配置好文件之后进行训练

13.那按你这样做的话，准确度能够控制在多少呢？

答：0.8-0.9吧

14.怎么提升这个准确度呢？

答：我回答要么训练次数更高一些，要么做数据增强

15.假如说这个表情识别的项目的受众群体是中国人比较多，但是数据集都是外国人，比如黑人和白人，这个会有什么影响？

答：我直接说由于黑人的嘴唇一般比我们国人要厚一点，可能我们的微笑在黑人那里会识别成假笑？

16.你一般用什么ai工具多一点?就只用过这些吗？

答：我说ChatGPT和deepSeek多一点，我还用过cursor里面的Gemini和Claude模型，只是ChatGPT和deepSeek用的多一点。

17.你觉得deepSeek这个模型是怎么做出来的？

答：我说是用ChatGPT的那个模型进行蒸馏，然后减少那个训练的数据集来降低成本

18.你需要什么样的条件你才能做出这种类型的模型出来。

答：我说好像是用要跟deepSeek差不多的一个训练环境，再模拟deepSeek的方法对ChatGPT进行一个蒸馏

19.假如说我要用deepSeek来让我的公众号实现像ai客服机器人一样去对话，我应该怎么做？

答：先利用爬虫的知识，在app上获取客户发送的消息。然后调用deepSeek的api来生成回答的文本，最后使用模拟器和selminum，DrissionPage这些自动化工具来模拟人的操作，将生成好的文本发送过去

20.那假如说企业有几十个微信账号，让它全都变成客户机器人呢？应该怎么做?

答：（这个我是真的不会了）下多几个模拟器进行类似的操作，或者使用网页版微信来增加它的那个ai客服的运行数据。

21.比如你那个电脑再使用这个自动化工具，我又不想让这个自动化工具影响我的日常微信的文件使用，我应该怎么做？

答：（这个其实我也不是很会）我说可以不用该脚本，可以想手机那样做应用双开？

22.那按你怎么做的话，跑这些模拟器的项目配置要多高？包括它这个链路该如何去串通起来？

这里有点答非所问了，我说了3080应该可以吧。

23.按你刚刚的那个配置对智能进行训练的话，大概要训练多久？

答：应该是一个星期吧。

24.你是明年毕业是吧，能够实习半年对吗？

答：是的。

反问环节~

总结：

这次面试让我深刻的意识到了自己的不足，对于这种场景题基本上是一点都不会，我的知识储备跟大佬们比肯定是不足的。我需要再好好的学习一些面试的题目。

写在最后：

我们可以在这里学习C++知识：

0voice · GitHub