机器学习算法工程师--实习面经

来源:互联网 发布:华兴资本知乎 编辑:程序博客网 时间:2024/05/15 21:26

最近找实习,整理一下面的比较完整的几家公司的问题,如果后面还有比较完整的流程再添加吧。
小米面试
一面

  • 给用户推荐一首歌,每首歌被推荐的概率和歌的评分成正比
  • 对上面的题进行优化,要求每次推荐歌的时间复杂度为O(1)
  • 给定一些字符,每个字符都可以出现或可以不出现,出现的字符的顺序和给定的保持一致,问一共有多少种出现方式
  • 对上面的题进行优化
  • 问了一道分类的应用题,,有点不记得是什么了

二面

  • 问了一道分类应用题
  • 两个链表是否存在公共节点,如果链表本身有环怎么办
  • 如果一个链表很长一个链表很短怎么优化

京东面试
一面

  • 先写了一道算法题,去掉链表中的重复元素
  • 智力题,三枚硬币如何等概率扔出0~4
  • 机器学习基础,LR损失函数,过拟合,正则化
  • 问项目,贝叶斯有什么改进,还问了一道,没有听明白题意的问题,什么归一什么鬼
  • 商品分类问题,只给商品id和分类去预测新的算法(文本分类、词频、语义)

二面

  • 先是问了项目,然后文本分类的工作,问如果现在做能怎么改进
  • 京东搜索“手机”,对搜索出来的商品怎么排序(提出了回归的模型,userCf模型,面试官说了一种learning to rank的想法)

微软面试
一面

  • 项目的相关问题,为什么不用mlib中自带的算法
  • gbdt和rf的区别
  • svm核函数相关的问题
  • 找有序数组中值为k的数的下标范围,可能有多个值为k的数

二面

  • 多个有序链表中的值相同的节点
  • java中的反射机制

头条面试
一面

  • 决策树的并行策略
  • 能否十分钟写出cart树
  • 视频分类应用(标题,作者的id和行为,视频详情,历史的用户数据和行为,用户评论)
  • 二叉搜索树找到一个节点并删除

二面

  • 连续子数组最大和的值和起始终止位置
  • 并行算法和mlib的区别,有没有什么算法上的改进
  • 文本分类svm调参,使用了什么核,手推svm
  • 为什么svm可以使用和函数,LR不可以使用
  • 手推牛顿迭代法和拟牛顿法

百度面试
一面

  • 项目
  • 机器学习算法的相关知识
  • spark和hadoop的区别
  • linux命令 awk,sort,grep
  • 二叉树的中序遍历非递归
  • Kmeans和KNN

二面

  • 问项目
  • 手推LR
  • 数组流找中位数,使用两个堆
  • 文件流随机挑选K行

三面

  • 问spark是啥。。
  • 个性化推荐
  • 线上的代码重构,出问题如何定位

嘀嘀新锐面试
一面

  • 简历上的东西
  • 结合偏差和方差说明gbdt和rf的区别,然后又围绕展开很多其他问题
  • spark的基本问题
  • spark程序运行很慢的原因

二面

  • 开始就聊工作预期bulabula
  • sgd的并行化思路
  • sgd并行化思路展开,一个并行任务运行很慢怎么办
  • 飞机寻找在沙漠中寻找黑匣子:飞机得到黑匣子的信号,有强弱的区别
  • 寻找黑匣子的过程像什么算法

美团面试
一面

  • 简历上的东西
  • 连续子数组的最大和
  • 字符串转整数
  • 研究生期间让自己觉得不错的项目

二面

  • 简历上的东西,为什么写贝叶斯和决策树
  • 论文
  • 时序算法的一些相关问题

三面
没什么技术问题,主要是简历上的东西以及是否有意愿来