AI开发实习生面试总结(持续更新中...)

1.广州视宴(ai开发实习生)

首先是自我介绍~

1.第二个项目中的热力图是用怎么样的方式去做的?

2.在第二个项目中,如何用热力图去实现它的实时变化

答:我这里直接说我项目里面其实静态的热力图,不是动态的

3.如果要你爬虫阿里或者百度的网站,你会怎么做?阿里的做了什么样的反爬机制?

答:我首先说了下百度的反爬机制,后面我发现我没有反爬过阿里的网站,我直接说不会了,现在想来这两个应该是差不多的。

4.OpenCV如果识别人脸和人的身体的话,你会用什么库,比如说你要识别人的身体骨骼的话。

5.你的这个项目是识别人脸的,那你如何确保别人贴个照片在脸上直接过呢?怎么判断它是不是真人?

这个不会

6.transformer模型有没有了解过?

答:我说了一下它的大概结构和自注意力机制

7.现在有一个企业内部资料库,假如你需要把它训练成一个ai智能体,用于相互对话的话,你该怎么做?(我说用这个内部资料库对本地部署的deepSeek-R1模型进行训练,然后使用Pythoweb开发前后端进行交互,把训练后的结果利用网页来让它能够实现相互对话)

8.具体究竟是怎么训练这个智能体的?(我说调用科大讯飞的api进行情感分析和自然语言处理,然后生成结果)

9.那假如我就是不能用api,就是要离线生成答案,我应该怎么做?(这个也不是很会)

10.MCP协议了解过吗?(还真不会)

11.如果让你用OpenCV来用于做情感的识别,你会怎么做?。

答:我回答说OpenCV有一个专门的库是用来识别人脸的,还有几个库是专门识别像微笑,伤心等表情的

12.那如果我要增加它的表情类目的话呢,比如我要识别160种表情,我应该如何去做?

答:当时都傻了,160种表情?我后面直接说只用OpenCV的话是做不到的,我会像我写的第一个项目那样,在Kaggle上下载各个表情下的数据集,然后用YOLOv11的模型在配置好文件之后进行训练

13.那按你这样做的话,准确度能够控制在多少呢?

答:0.8-0.9吧

14.怎么提升这个准确度呢?

答:我回答要么训练次数更高一些,要么做数据增强

15.假如说这个表情识别的项目的受众群体是中国人比较多,但是数据集都是外国人,比如黑人和白人,这个会有什么影响?

答:我直接说由于黑人的嘴唇一般比我们国人要厚一点,可能我们的微笑在黑人那里会识别成假笑?

16.你一般用什么ai工具多一点?就只用过这些吗?

答:我说ChatGPT和deepSeek多一点,我还用过cursor里面的Gemini和Claude模型,只是ChatGPT和deepSeek用的多一点。

17.你觉得deepSeek这个模型是怎么做出来的?

答:我说是用ChatGPT的那个模型进行蒸馏,然后减少那个训练的数据集来降低成本

18.你需要什么样的条件你才能做出这种类型的模型出来。

答:我说好像是用要跟deepSeek差不多的一个训练环境,再模拟deepSeek的方法对ChatGPT进行一个蒸馏

19.假如说我要用deepSeek来让我的公众号实现像ai客服机器人一样去对话,我应该怎么做?

答:先利用爬虫的知识,在app上获取客户发送的消息。然后调用deepSeek的api来生成回答的文本,最后使用模拟器和selminum,DrissionPage这些自动化工具来模拟人的操作,将生成好的文本发送过去

20.那假如说企业有几十个微信账号,让它全都变成客户机器人呢?应该怎么做?

答:(这个我是真的不会了)下多几个模拟器进行类似的操作,或者使用网页版微信来增加它的那个ai客服的运行数据。

21.比如你那个电脑再使用这个自动化工具,我又不想让这个自动化工具影响我的日常微信的文件使用,我应该怎么做?

答:(这个其实我也不是很会)我说可以不用该脚本,可以想手机那样做应用双开?

22.那按你怎么做的话,跑这些模拟器的项目配置要多高?包括它这个链路该如何去串通起来?

这里有点答非所问了,我说了3080应该可以吧。

23.按你刚刚的那个配置对智能进行训练的话,大概要训练多久?

答:应该是一个星期吧。

24.你是明年毕业是吧,能够实习半年对吗?

答:是的。

反问环节~

总结:

这次面试让我深刻的意识到了自己的不足,对于这种场景题基本上是一点都不会,我的知识储备跟大佬们比肯定是不足的。我需要再好好的学习一些面试的题目。

写在最后:

我们可以在这里学习C++知识:

0voice · GitHub

相关推荐
xiaolyuh12310 小时前
【XXL-JOB】 GLUE模式 底层实现原理
java·开发语言·前端·python·xxl-job
数据智研10 小时前
【数据分享】(2005–2016年)基于水资源承载力的华北地区降水与地下水要素数据
大数据·人工智能·信息可视化·数据分析
likuolei10 小时前
Spring AI框架完整指南
人工智能·python·spring
梵得儿SHI10 小时前
(第四篇)Spring AI 核心技术攻坚:多轮对话与记忆机制,打造有上下文的 AI
java·人工智能·spring·springai生态·上下文丢失问题·三类记忆·智能客服实战案
二哈喇子!11 小时前
PyTorch生态与昇腾平台适配:环境搭建与详细安装指南
人工智能·pytorch·python
Learner11 小时前
Python数据类型(三):列表和元组
开发语言·python
世界唯一最大变量11 小时前
用自创的算法快速解决拉姆奇数
python
leluckys11 小时前
AI- 一种快速实现MCP服务的方法
开发语言·python
lingzhilab11 小时前
零知ESP32-S3 部署AI小智 2.1,继电器和音量控制以及页面展示音量
人工智能
写代码的【黑咖啡】11 小时前
探索 Python 中的 Vaex:高效处理大规模数据的新选择
开发语言·python