搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 招聘消息汇总 > 最全的算法/机器学习面经送给你

最全的算法/机器学习面经送给你

招聘消息汇总 2017-11-28

来源:牛客网


之前一直在牛客上刷题和看面经,希望能够借此回馈一下牛客和牛油们。


最全的算法/机器学习面经送给你

因为本硕双非,又偏偏只找算法岗和机器学习岗,所以经历了很多面试,关于秋招找工作,我只想说两句话:


1、岗位匹配度。
2、offer=实力+运气。 


下面是我面试中被问到的问题,希望能够帮到大家


便利蜂

01

一面(内推无笔试,40min)


1、问实习项目

2、特征工程做的有哪些?非线性可分的情况怎么处理的?

3、SVM的函数了解多少?

4、L1和L2区别?L1为啥具有稀疏性?

5、xgboost的原理

6、sigmoid的函数的导函数取值范围是多少?其实就是一元二次方程y值得范围,0—1/4


02


1、实习内容:数据之间的关系和特征?

2、Python中协成的概念,及微线程,具体可以看廖雪峰的网站

3、C++中vector增删改的复杂度,O(1)  O(n)

4、MySQL中索引用的什么数据结构?

5、Hash_table的底层是什么实现的?拉链法,数组+链表

6、HBase的列式存储解释

7、面试官建议多注重工程方面的能力,全程不问机器学习方面的问题。

     

链家
▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼▼
一面(内推笔试过后,40min)

1、面试前全体做四道编程题:
 (1)数组中出现次数超过一半的数
 (2)括号匹配
 (3)一串珠不同颜色,求包含所有颜色的最短子串
 (4)从日志中找出IP出现次数超过1024次的恶意IP
2、最小二乘与极大似然函数的关系?从概率统计的角度处理线性回归并在似然概率为高斯函数的假设下同最小二乘简历了联系
3、LR为啥是个线性模型?本质就是线性的,只是特征到结果映射用的是sigmoid函数,或者说回归边界是线性的,即P(Y=1|x)=P(Y=0|x)时有W*x=0
4、Hadoop中MR是怎么实现联表查询的?
5、分类的评价标准,准确度,AUC,召回率等等
6、有的逻辑回归损失函数中为啥要加-1*m
7、欠拟合的解决方法?模型简单,加深神经网络,svm用核函数等等
8、L2正则的本质?限制解空间范围,缩小解空间,控制模型复杂度
9、SVM引入核函数本质?提高维度,增加模型复杂度
▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲

滴滴

一面(内推笔试过后,45min)


1、介绍实验室的项目
2、介绍xgboost、gbdt、rf的区别
3、树模型的特征选择中除了信息增益、信息增益比、基尼指数这三个外,还有哪些?
4、Sklearn中树模型输出的特征重要程度是本身的还是百分比?
5、介绍下SVM以及它的核函数
6、熟悉FM算法不?
7、算法题:两个链表的第一个公共节点



二面(15min)

1、面试官一直看时间,感觉就是为了走个过场
2、介绍下实验室项目
3、进程和线程的区别?
4、HBase数据库的优点?
5、闲聊。。。你想从事哪方面的算法?c++用了几年?有   啥问我的吗?我是做路径优化的


中兴

一面(基础面,20min)


1、两个面试官,一个大叔,一个女的,貌似领导级别
2、问实习项目,重点关注特征工程和模型选择方面,为啥用深度学习,当时调参的具体数据是多少?多层的神经网络有没有用GPU?
3、有啥问我们的么?我们主要在天津做AI方面,涉及金融,比较缺人(其实是缺985。。)



二面(综合面 20min)


1、两个很年轻的面试官小哥,来自北京燕郊那儿的
2、全程不问任何技术,聊人生,性格怎样,喜欢看啥书,打游戏不?本科为啥学的数学?blabla。。。
3、有啥问我们的没?我们来自北京燕郊那儿的,业务主要是通信研发,无算法岗位,且他们主要用


完美世界

数据开发工程师(一面挂  30min)


1、两个面试官,其中一个主要负责问
2、介绍实习项目,怎么判断特征的重要性?rf与gbdt的区别讲下?
3、对实验室的项目丝毫不感兴趣,面试官果然不是做算法的。。。
4、算法题:两个数字链表求和,将结果也存到一个链表里面,注意相加超10时进位就行



最全的算法/机器学习面经送给你

陌陌


一面(1h)


1、介绍实验室项目,对问题是回归还是分类进行了详细探讨。。。
2、LR与SVM的区别
3、GBDT与XGBoost的区别?
4、实习期间遇到的问题,是怎么解决的?
5、了解FM吗?GBDT的数据在使用前有什么需要注意的吗?
6、做过广告点击率预估没?LR+GBDT和GBDT+FM怎么结合的知道不?



二面(15min)


1、LR与GBDT的结合了解不
2、智力算法题(说是它的校招笔试题):
   f(x)=p,y=0;  1-p,y=1  将这个概率函数转换为T(x)=1/2,   y=0或者y=1
   提示:f(x)执行四次可能出现的结果有0,0:p^2            0,1:p*(-1p)         1,0:p*(1-p)          1,1(1-p)^2
   里面有两次结果的概率是一样的



hr面(20min)


1、来一很结实的HR小哥哥。。。很少看见男的HR。。
2、说说自己的优缺点
3、喜欢啥样的老板和同事
4、期望薪资?我们发15个月的,还有加班费
5、如果有其他公司的offer,你会怎么选


最全的算法/机器学习面经送给你



美团

一面(40min)


1、总的来说,美团的面试官还是很好的,循循善诱,技术不是太差的话,应该都能过
2、介绍了实习项目,数据特征怎样选择的?怎样表示的?模型的选择?当时的模型参数是多少?结果效果如何?
3、RF与GBDT的区别?为啥你要用集成的方法而不用准确度更高的算法模型?
4、推导LR
5、编程题:删除链表中倒数第K个节点,写出来后,面试官加难度:如果是个带环的链表呢?也就是先找到环的入口,再注意边界条件就行
6、有什么问我的么?我们是风控部门,主要涉及资金、账号安全,作弊,刷单,反爬虫等




二面(30min)


1、纳尼?!美女面试官!秋招期间碰到的唯一一个女的算法面试官,还是美女。。。。
2、介绍实验室项目,交流下预测那里怎么做的
3、为啥LR的输入特征一般是离散的而不是连续的?
4、了解各种优化算法不?梯度下降和随机梯度下降的区别?牛顿法和拟牛顿法的区别?为啥提出拟牛顿?因为牛顿法涉及海塞矩阵,它的逆矩阵求解很麻烦
5、KNN的使用场景
6、智力题:
1<=a,b<=99,甲手里有a+b的结果,乙手里有a*b的值,两人目前都不知道a和b的值,两人对话如下:
1甲:你肯定不知道a,b的值是多少
2乙:我好像知道了
3甲:我好像也知道了
问:a,b的值是多少
思路:对话1说明a+b的可能性有多种组合,其对应的乘积也有多种组合,形成两个集合S和T
对话2说明乙根据手里的乘积结果,可以得出S和T这两个集合的交集是唯一的
对话3说明甲猜到了乙的想法,故也能猜出交集唯一。。。




三面(30min)


1、这个面试官貌似是一总监或者技术经理
2、介绍实习项目,和上面的类似
3、项目期间遇到的问题以及怎么解决的?
4、从数学角度和你的个人理解完整推导和讲解LR
5、又仔细讲了下风控部门的主要业务,




hr面(20min)


1、自我评价,自己的优缺点
2、工作中遇到的问题怎么解决的
3、家庭对你的影响
4、遇到的最遗憾的事情,最有成就的事情,最后悔的事情,what?!这是要闹哪样。。。
5、朋友和同事对你的评价



百度

一面(1h)


1、很年轻的面试官,问的很广,感觉回答出来了80%,依然没过
2、介绍实验室项目,是怎样用的KNN进行的预测
3、XGBoost与RF的区别
4、RF的随机性体现在哪里?它的代码中输出的特征重要程度是怎么进行计算的?
5、实习项目中的评价标准是什么?accuracy和precision、recall这些一样吗?AUC的解释
6、了解哪些损失函数?区别是啥?
7、线性模型为何用的最小二乘作为损失函数而不用似然函数或者交叉熵?
8、了解哪些深度学习模型?keras底层用TensorFlow和theano时,代码有何不同?TensorFlow原理、流程图,session是啥?
9、编程题:两个数组的最长公共子序列和最长递增子序列,用DP写出来后,让继续优化。。。


去哪儿

一面(30min)


1、去哪儿没有纯算法岗么?官网也是把算法归档为开发工程师里面去了。。。
2、面试官是一个做后天开发和存储的,注定要尬聊!
3、自我介绍,简历上的机器学习项目一个都不细问,刚推了两个公式,打断我停止。。。
4、本科数学?计算机基础知识会吗?TCP与UDP区别,三次握手,四次挥手解释下?
5、知道哪些linux命令,知道多少说多少
6、选个语言,python的数据结构有哪些?都有哪些特性?但是这面试官不搞python,对我说的丝毫不感冒
7、数据库了解多少?mysql的引擎InnoDB是怎么实现的?
8、场景题1:如何针对邮箱中用户名和手机号的匹配和存储,实现以下功能:
1>数据量很大,存储方案怎么设计
2>根据用户名快速检索出对应的手机号
3>如何保证用户名的唯一性
场景题2:模拟高德地图或者百度地图中,求两地间的最短路径?只考虑公路这一种情况,没清楚面试这是搞哪样。。。



京东(一面挂,20min)


1、自我介绍,全程不写代码。。。
2、聊实习项目,特征工程,模型选择,项目中的细节,你是如何选择算法模型的?效果如何?
3、重点来了,你有什么问我的么?哦,我们是无人机部门,涉及到视觉,路径规划,通信方面的算法,基本没有传统机器学习算法业务,WTF?


未完待续。。。


点击下方“阅读原文”查看完整内容

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《最全的算法/机器学习面经送给你》的版权归原作者「招聘消息汇总」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注招聘消息汇总微信公众号

招聘消息汇总微信公众号:zpxxhz

招聘消息汇总

手机扫描上方二维码即可关注招聘消息汇总微信公众号

招聘消息汇总最新文章

精品公众号随机推荐