如何准备机器学习工程师的面试
我之前面试一些公司的机器学习或者数据挖掘工程师的职位。感觉自己准备的不够充分。想了解下一般会问哪些问题,考察哪些方面的东西。
机器学习方面的面试主要分成三个部分:
1. 理论方面,我推荐最经典的一本书《统计学习方法》,这书可能不是最全的,但是讲得最精髓,薄薄一本,适合面试前突击准备。 我认为一些要点是: 统计学习的核心步骤:模型、策略、算法,你应当对logistic、SVM、决策树、KNN及各种聚类方法有深刻的理解。能够随手写出这些算法的核心递归步的伪代码以及他们优化的函数表达式和对偶问题形式。 非统计学习我不太懂,做过复杂网络,但是这个比较深,面试可能很难考到。 数学知识方面,你应当深刻理解矩阵的各种变换,尤其是特征值相关的知识。 算法方面:你应当深刻理解常用的优化方法:梯度下降、牛顿法、各种随机搜索算法(基因、蚁群等等),深刻理解的意思是你要知道梯度下降是用平面来逼近局部,牛顿法是用曲面逼近局部等等。
2. 工程实现能力与编码水平 机器学习从工程实现一般来讲都是某种数据结构上的搜索问题。 你应当深刻理解在1中列出的各种算法对应应该采用的数据结构和对应的搜索方法。比如KNN对应的KD树、如何给图结构设计数据结构?如何将算法map-red化等等。 一般来说要么你会写C,而且会用MPI,要么你懂Hadoop,工程上基本都是在这两个平台实现。实在不济你也学个python吧。
3. 非常令人失望地告诉你尽管机器学习主要会考察1和2 但是实际工作中,算法的先进性对真正业务结果的影响,大概不到30%。当然算法必须要足够快,离线算法最好能在4小时内完成,实时算法我没搞过,要求大概 更高。 机器学习大多数场景是搜索、广告、垃圾过滤、安全、推荐系统等等。对业务有深刻的理解对你做出来的系统的结果影响超过70%。这里你没做过实际的项目,是 完全不可能有任何体会的,我做过一个推荐系统,没有什么算法上的`高大上的改进,主要是业务逻辑的创新,直接就提高了很明显的一个CTR(具体数目不太方便 透露,总之很明显就是了)。如果你做过实际的项目,一定要主动说出来,主动让面试官知道,这才是最大最大的加分项目。 最后举个例子,阿里内部机器学习挑战赛,无数碾压答主10000倍的大神参赛。最后冠军没有用任何高大上的算法而是基于对数据和业务的深刻理解和极其细致 的特征调优利用非常基本的一个算法夺冠。所以啥都不如真正的实操撸几个生产项目啊。
-
生产主管如何面试
生产主管如何面试(一)一、当你车间出现批量的排孔,你将如何做纠正预防措施。(10分)二、如何才能做好你车间的5S工作.(10分)三、当你的员工因为材料损失责任扣款太多,发工资后要吵着辞工离职,你将怎么做。(10分)四、当你车间的进度经常受到物料供应不足而影响到...
-
如何在招聘中巧妙提问,识别面试者的潜质
公司往往是创始人组建的团队生产出来的产品,但如果仅靠你自己,根本无法打造一家伟大的公司。招聘是一个公司至关重要的一件事,如果你的招聘失败,你可能无法获得成功。对于创业公司来讲,需要的是具备以下这七种素质的人,那又该如何在面试中巧妙发现面试者是否具备这些...
-
如何面试谈薪水
如何面试谈薪水这是求职者都会关心的问题,下面本站就说一说如何谈到点子上?在回答薪金问题的时候,不能乘匹夫之勇乱答一气,要有准备,要有策略:把期望值放到行业发展的趋势去考虑你的专业是什么?人才市场对你这类人才的需求有多大?留意一下你周围的人:你的同学、你的朋友...
-
面试中如何把握好自我介绍
1.一分钟谈一项内容自我介绍的时间一般为3分钟,在时间的分配上,第一分钟可谈谈学历等个人基本情况,第二分钟可谈谈工作经历,对于应届毕业生而言可谈相关的社会实践,第三分钟可谈对本职位的理想和对于本行业的看法。如果自我介绍要求在1分钟内完成,自我介绍就要有所侧...