自我介绍
项目:
介绍项目
你这个项目和别人已有系统的项目相比,优势在哪里?如果别人系统的数据要迁到你这个系统里来,应该怎么做?
服务部署有了解吗?一个节点如果只能部署一个服务不是很浪费吗?那如果我要一个服务部署两次,就需要两台服务器?(我反问了为什么会一个服务部署两次呢?他说如果用户量上来了,那一个系统只对应一个服务肯定是不够的,肯定是要分布式部署的,部署多个,然后把流量打到多个服务上)
如果你这个用户量上来了,服务要怎么升级才能抵住高并发的情况?比如你这个子服务要频繁的触发,那如果高并发的情况下,这个服务只部署了一个节点,没有分布式部署的话,效率是不是很低?
如果分布式部署了,数据库和缓存这些怎么同步到每个节点上呢?
如果新的功能要上线,目前是怎么做的?是直接把旧的服务停掉,然后部署新的吗?还是怎么做?
容器了解过吗?(我这里说用到了K8S,所以问了这个。但确实Docker用的不多,就说的没怎么了解)
简历上写了Ingress-Nginx,有了解过Nginx吗?Nginx主要的功能有哪些?(负载均衡,反向代理)
Nginx负载均衡具体是怎么做的?(就说了个轮询,均匀的将请求打到每个服务上,也不知道对不对)
Java(部门是写C++、Python的,所以问的不多):
集合最常见的有List、Set、Map,区别在哪里(说了一下底层实现)
你说List是动态数组,扩容过程是什么?(创建新数组,容量1.5倍)
Set是怎么去重的?(哈希表)
哈希冲突了怎么解决的?(拉链表)
Map也是哈希表,那和Set有什么区别?(这里我还真不知道,我一直看的Map的结构,没看Set。我就说Map不只有链表,还有红黑树,主要是为了优化链表过长时的查询速度)
MySQL:
你们这个项目数据中,文字和图片分别是怎么存的?(文字存字符串,图片用OSS、存链接)
慢sql可能有哪些情况?如何解决?(我说了三个,没用索引;是网络情况;范围查询查询的范围过大,导致遍历的树节点较多,每个节点都是一次IO操作)
如何排查慢sql?(没用索引用explain select;网络情况瞎扯的,就看一下接口请求时间是不是并平常长)
explain select的执行结果只能看索引是否命中吗?有没有其他的作用?(不知道)
索引建立一般有什么原则?(最常用的建立吧)
索引建的越多越好吗?(不是,因为索引一旦建立了,会有两方面的消耗,一个是磁盘占用,一个是数据在更新的时候也会同步更新索引,这些都是性能消耗)
最常用的列建立索引就一定能优化速度吗?(不一定,因为可能这个列可能有很多重复数据)
如果索引命中了查询还是很慢,可能有哪些情况?(说了数据量多,然后提到分库分表)
分库分表,具体是怎么分呢?分了之后数据在不同的地方,那查询数据又是怎么查的呢?(这里说的乱七八糟,本身也不太懂)
MySQL日志了解过吗?(说了一下binlog日志文件)
如果MySQL删除了行数据,发现磁盘占用空间不大,可能有哪些情况?(数据本身是空的,没有填值;删除的数据占用空间本身比较小,不是大数据类型)
计网:
Socket编程了解吗?(有两个编程模型,TCP和UDP的)
TCP编程模型用到了哪些系统调用?(socket/bind/listen/connect/accept/recv/send/close)
connect这个系统调用主要是在干嘛?(TCP三次握手)
三次握手流程说一下(经典八股)
三次握手有数据的交换吗?交换的什么数据?(确认号和序列号)
手撕:
先给了个非递归后续遍历二叉树,我说可能不太能写出来,就换了个:二叉树中有一个数出现了一次,其他的都出现了两次,找到这个树。(遍历 + 异或秒了)
反问:
部门能在说一下吗?(csig、腾讯云、网络产品中心,地点在深圳)
业务是做什么的呢?ToB还是ToC?(ToB)
部门为什么会用Python和C++呢?(IO密集用Python,CPU密集用C++。在IO方面,Python和Java差不多,但是Python本身写起来比较方便)
总结:
除了一些项目相关的开放性问题只能扯几句,大部分都能答上来,体验还行,就是不知道能不能过。。面试官也挺好的。之前听说腾讯问OS、计网比较多,但这次其实一点OS都没问,还是跟部门相关。
待改进:
基础部分
Java:Set和Map的区别还得再看一下MySQL慢SQL有哪些情况,怎么排查,怎么解决?explain有哪些作用MySQL日志能不能查看SQL语句执行速度?
项目部分,看一些常见的服务升级方案
分布式服务部署MySQL分库分表Nginx相关的