BAT机器学习面试题及解析(266-270题)

来源:互联网 发布:淘宝代销怎么下单 编辑:程序博客网 时间:2024/06/05 00:30

本系列作为国内首个AI题库,囊括绝大部分机器学习和深度学习的笔试面试题、知识点,可以作为机器学习自测题,也可以当做查漏补缺的资料库。在线题库见官网首页(点击文末“阅读原文”)

以下题目:点击下方空白处可显示答案

266.对于下面三个模型的训练情况, 下面说法正确的是 :

1. 第一张图的训练错误与其余两张图相比,是最大的

2. 最后一张图的训练效果最好,因为训练错误最小
3. 第二张图比第一和第三张图鲁棒性更强,是三个里面表现最好的模型
4. 第三张图相对前两张图过拟合了
5. 三个图表现一样,因为我们还没有测试数据集

A. 1 和 3

B. 1 和 3

C. 1, 3 和 4

D. 5

答案: C

267.对于线性回归,我们应该有以下哪些假设? 

1. 找到利群点很重要, 因为线性回归对利群点很敏感
2. 线性回归要求所有变量必须符合正态分布
3. 线性回归假设数据没有多重线性相关性

A. 1 和 2

B. 2 和 3

C. 1,2 和 3

D. 以上都不是

答案: D

  • 利群点要着重考虑, 第一点是对的

  • 不是必须的, 当然, 如果是正态分布, 训练效果会更好

  • 有少量的多重线性相关性是可以的, 但是我们要尽量避免

268.当我们构造线性模型时, 我们注意变量间的相关性. 在相关矩阵中搜索相关系数时, 如果我们发现3对变量的相关系数是(Var1 和Var2, Var2和Var3, Var3和Var1)是-0.98, 0.45, 1.23 . 我们可以得出什么结论:?

1. Var1和Var2是非常相关的
2. 因为Var和Var2是非常相关的, 我们可以去除其中一个
3. Var3和Var1的1.23相关系数是不可能的

A. 1 and 3

B. 1 and 2

C. 1,2 and 3

D. 1

答案: C

  • Var1和Var2相关系数是负的, 所以这是多重线性相关, 我们可以考虑去除其中一个.

  • 一般地, 如果相关系数大于0.7或者小于-0.7, 是高相关的

  • 相关性系数范围应该是 [-1,1]

269.如果在一个高度非线性并且复杂的一些变量中“一个树模型可能比一般的回归模型效果更好”是

A. 对的

B. 错的

答案: A

270.对于维度极低的特征,选择线性还是非线性分类器?

非线性分类器,低维空间可能很多特征都跑到一起了,导致线性不可分。

1. 如果Feature的数量很大,跟样本数量差不多,这时候选用LR或者是Linear Kernel的SVM
2. 如果Feature的数量比较小,样本数量一般,不算大也不算小,选用SVM+Gaussian Kernel
3. 如果Feature的数量比较小,而样本数量很多,需要手工添加一些feature变成第一种情况。

《BAT机器学习面试1000题系列》往期题目:

BAT机器学习面试1000题系列(第1~60题)

BAT机器学习面试1000题系列(第61~100题)

BAT机器学习面试1000题系列(第101~200题)

BAT机器学习面试1000题系列(第201~250题)

BAT机器学习面试1000题系列(第251~255题)

BAT机器学习面试1000题系列(第256~260题)

BAT机器学习面试1000题系列(第261~265题)




原创粉丝点击