2017年面试小结

来源:互联网 发布:博实股份是人工智能吗 编辑:程序博客网 时间:2024/05/24 03:04

     看见去年四月写的唯一一篇博客真是笑了哈哈,现在是2017年9月中,距离去年7月毕业,已经工作1年多了,也做了数据挖掘一年了,但是计算机小白还是计算机小白。
     最近准备换工作,公司不准备继续做数据挖掘这块了,小公司的业务变化太快。     
     面试了将近1个月了,目前拿到的offer都不是太合适。稍微总结一下面试遇见的问题。这次面试面了数据挖掘,数据分析岗位,面试的公司有证券公司,银行卡中心运营部门,教育公司,金融产品公司,旅游公司,通信公司等,外卖公司,某国企支付公司等。
      总结数据挖掘,分析岗位:
      一.数学功底
      这部分考察较少,一般会是简单问一下,学过的课程,数理统计,多元统计,线性函数等。
      也遇见过会问最速下降法原理,最小二乘法拟合的数学式子,给一个常见的快速收敛到0,1的函数等。这部分我认为《数值优化》相关课程应该复习一遍。
      二.算法
      建模是数据挖掘的主要方法,算法基础要扎实。虽说实际工作中,业务占70%,算法占30%,但是算法仍然是最重要的基础,不能仅仅停在应用层面上,了解原理能更好的选择模型,提升建模效果,达到尽可能的上限。
       在这部分中,
       多元统计:线性回归,逻辑回归,主成分分析,因子分析,聚类算法
       机器学习:决策树,支持向量机,随机森林,xgboost
       神经网络
       面试中常遇到的问题:
       1.逻辑回归,决策树的原理,但是也遇到问GBDT,xgboost。
       2.k-means聚类如何确定k,如何确定中心点
       3.xgboost中调参中你常调的参数
       4.什么是过拟合,欠拟合,解决办法是什么
       这部分准备面试的时候,一定多复习自己做过的项目,回顾做的工程。把其中每个过程中遇到的问题,用过的解决办法想起来,越细节越好。
      三.特征工程    
      1.如何选取特征
      2.缺失值,异常值,你的标准是什么
      3.如何补全缺失值
      4.如何把特征正则化,具体有哪些方法
      5.有没有尝试变化特征的形式
      四.业务
      大多公司会在电话中稍微沟通完一,二部分,确定技术基本过关后,面试时业务部分一般占了面试的大半,面试官会给出很多业务场景给你分析。主要还是考察分析问题的能力。面试前还是应该在公司相关业务上多了解。
      五.工具
      这部分主要是建模工具,python,R等,问题不大,会其一即可。
      SQL会多问一点,有的会有笔试题,主要是根据业务问题出一些简单的SQL查询题,问题不大,但是要细心,面试前多做几道。
      后面就是可能希望有Hadoop,spark,hive经验,但是没有公司会专门问这个,问题不大。也看见有人说面试会问例如k-means如何在Hadoop上实现,但是我没有遇见过,可能是面试比较初级的算法,暂时不做这方面工作。
     每次面试就会知道自己的不足,去年一年还是太懈怠了,新一年要更努力学好基础和业务。