微博实习生面试记录

来源:互联网 发布:淘宝网上怎么买二手货 编辑:程序博客网 时间:2024/06/05 17:15
  • 一面(大约1个小时):

    • 自我介绍
    • 项目(项目问了特别久,因为我项目里用到了spark gbdt,所以让我讲一下gbdt的原因,问我的数据集多大,树怎么调参的等等引申问题
    • hive sql统计昨天访问过的用户并且今天没有访问的用户
    • 算法题

      输入点对:A BC DH IB GH J输出:A B GC DH I J类似这样的对,实现合并
  • 二面(大约1个小时)

    • 自我介绍
    • 算法题:LeetCode#64原题 我用二维数组DP写出来了 面试官的follow up 如何优化空间复杂度即用o(n)实现
    • 100w个数,如何找出前K大的数 (我一开始回答利用集群来处理,后面面试官想听到的其实是堆排序和快排来实现)
    • 聊项目
    • 推导LR
    • LR怎么防止过拟合
    • L1和L2(L1和L2是什么,为什么L1能产生稀疏解)
    • 线性相关特征对LR和GBDT训练结果会有影响?
    • 概率题:从1-M这M个数中有放回的随机抽取K次,求最大值的期望(这个题目一开始我没有get到题意)M的k次幂-(M-1)的K次幂,再除以M的k次幂

    大概记得的就这些内容了,二面面试官看起来很强

原创粉丝点击