一些算法岗的校招面经

来源:互联网 发布:matlab求解矩阵方程组 编辑:程序博客网 时间:2024/05/17 22:03

从今年3月份暑期实习到秋招一直投的算法岗(数据挖掘、机器学习),今年听说投算法的人特别多,竞争激烈,自己之前本来想去金融,后来觉得还是喜欢互联网,从去年11月才开始好好看书,又不是CS科班出身,所以面试毫无优势可言。基本上把大半个互联网公司都面了一遍,虽然挂的太多,但面试官水平都很高,面试中也学到了很多东西,认识到很多地方不足,要学的东西太多。

 

有的时间太久,细节想不起来了,想起来再慢慢更新,把不知道的知识点补上,写的乱凑合着看

 

携程(实习):

1.    讲项目

2.    写一下LR损失函数

3.    SQL题,很简单,但当时没想出来…

4.    GBDT、xgboost用过吗,解释一下

5.    距离公式有哪些(余弦距离等)

6.    特征怎么选择

7.    随机森林

8.    优化BFGS了解吗

 

滴滴(实习+校招):

过完年回来,参加映像最深刻的实习面试,全程3小时,其实问的很基础,但是自己没有好好准备,很多基础掌握不牢。

1.     讲项目

2.     SQL:leftjoin、inner join区别,写了一道题

3.     SVM是什么、核函数有哪些、怎么选择

4.     LR损失函数推导一下

5.     随机森林、Adboost

6.     AUC、ROC、recall、precision写公式,AUC的直观解释

7.     CNN的卷积公式

8.     损失函数不可导,梯度下降法怎么办?(次梯度?)

9.     Python中list和tuple的区别

10.   正负样本不平衡怎么办

11.   决策树怎么剪枝

12.   问了些数据结构

 

校招(没面完):

1.     写个快排、改进、find(s,p),写了4道代码题

2.     200G日志用笔记本找Top100的query

3.     解释一下xgboost

4.     讲项目,用到了哪些特征

 

阿里(实习+校招)

内推的蚂蚁的风控部门

一面:

1.    7月底就打了电话,主要是讲项目,然后针对项目提了很多问题,面试官水平很高

2.    数据样本构造、样本选取

3.    讲了word2vec以及怎么应用

4.    看过什么前沿的论文

5.    垃圾评论检测

 

二面(挂):

1.    聊项目

2.    文本相似度计算为什么不用SVD…

3.    了解哪些优化算法

 

腾讯(实习+校招)

实习做了笔试,邀请到酒店面试,是一个小哥,很和蔼

1.    自我介绍,讲了一个项目

2.    Xgboost、随机森林的区别,xgboost怎么并行

3.    L1、L2正则化的区别,为什么L1得到稀疏解

4.    解释一下SGD、drop_out、神经网络的BN层

5.    代码题:最长子序列的乘积

(第二天查了状态是复试中,但到最后也没收到复试通知,最后一天查状态挂了…)

 

秋招内推,腾讯游戏的部门

一面(视频面,全程写代码)

1.    写LR公式

2.    DNN前向传播、反向传播,求梯度

3.    实现一下shuffle函数

4.    了解强化学习、增强对抗学习吗(不了解)

 

二面(挂):

1.    讲项目

2.    K-means、随机森林、DNN怎么调参

3.    怎么防止过拟合

4.    C++内存怎么分配(说不知道,直接跪)

5.    写C字符串拷贝函数strcpy

6.    写判断是否二叉排序树

 

美团(校招)

1.     推荐算法:SVD、协同过滤等,怎么做推荐的

2.     解释一下CNN、RNN

3.     数据怎么处理、特种工程

4.     特征选择怎么做、决策树怎么分裂的

5.     推荐系统好坏评价

6.     解释一下AB测试

7.     提高外卖配送效率,需要考虑哪些因素

8.     样本怎么构造、数据量有多大

9.     余弦距离和欧氏距离区别

10.   评论反作弊(被问了不下于3次)

 

京东(实习+校招)

校招投的上海这边算法组,面了两面说对我很满意,要给部门老大看,但不一定有offer,因为老大手上简历太多…

1.    讲项目,特别是衡量指标

2.    怎么做推荐的

3.    决策时、GBDT、Xgboost讲一下区别

4.    Sql题:怎么用join实现分组排序和分组累加和

5.    问了项目的word2vec和doc2vec算法、问了推荐怎么做的

6.    LSTM和RNN区别

 

百度(校招)

先是内推,面完3面后很久没收到消息,就知道挂了

一面:

1.    xgboost与GBDT比较

2.    Python中numpy为什么快,说用的C实现,然后问C++中STL底层,完全不会

3.    Python中能表示的最大数

4.    怎么做推荐、文本处理方法

5.    写代码:求两个字符串的最小编辑距离

 

二面:

1.     CNN怎么做文本分类

2.     怎样快速计算x的根号3次方,有内存限制,不能调库函数(这个问题纠结了很久)

 

三面:

经理面,从技术到人生都问了很多

1.     写个代码,求两个有序数组的交集,O(n),没想出来,只想出了一个二分查找

2.     协同过滤

3.     开放题,输入一个刘,弹出刘德华之类的,怎么做

 

校招霸面:

二面是百度凤巢的,感觉水平很高,答的不好,挂了

1.     信息熵、信息增益、相对熵、交叉熵、互信息、基尼系数

2.     常用的有哪些损失函数,推导一下log loss的梯度

3.     写个代码:快速排序,平均时间复杂度、最坏情况

4.     怎样确定采样的样本数量

5.     特征工程怎么做

6.     特征值、特征向量解释一下

7.     解释一下决策树、随机森林

8.     推荐系统考虑的因素特征

9.     路径优化考虑哪些因素

10.   写个代码:字符串去重函数

 

爱奇艺(校招)

1.    写个二叉树反转

2.    信息熵公式

3.    CNN卷积的物理含义、pooling的作用

4.    画一下word2vec中的skip-gram模式图

5.    概率题:54张抽出2张同花色的概率,大小王任意一种花色都不算

 

还面了华为、唯品会之类的,基本都是聊项目,所以没什么好写的,后面想起了再更新

原创粉丝点击