机器学习笔试

来源:互联网 发布:怎么查看手机端口号 编辑:程序博客网 时间:2024/06/08 10:24

(1)自然条件下,使熵最大化的数据分布形式是 均匀分布

熵越大越混乱,而越均匀代表越无序,也就是越混乱


(2)贝叶斯定理表达式:P(A|B)=P(B|A)P(A)/P(B)


(3)机器学习五大流派:进化学派、联结学派、符号学派、贝叶斯派、类推学派。知识点链接


(4)如果一个神经网络用于预测一种事物的分类,例如分为A、B、C、D四类,那么下列哪一个激活函数适用于该神经网络的输出层:Softmax

Relu一般用于隐含层的激活,而TanH和Sigmoid太慢;输出层:如果是分类则用Softmax,回归则用Linear。知识点链接

(5)a.矩阵的特征值揭示了矩阵包含的信息量

(特征值越大,说明矩阵在对应的特征向量上的方差越大,概率越大,信息量越多)

b.矩阵行满秩即行向量线性无关

d.矩阵的行秩和列秩总是相等


(6)a.卷积神经网络一般用于图像处理等局部特征相关的数据

b.强化学习以输入数据作为对模型的反馈

c.监督学习和非监督学习的区别在于是否要求样本数据带标签


(7)机器学习算法属于监督学习的是:SVM、朴素贝叶斯、线性回归等。

a.监督式学习算法:回归模型、决策树、随机森林、K邻近(KNN)算法、逻辑回归等。知识点链接

b.无监督式学习算法:关联规则、K-means聚类算法等

c.强化学习:马尔可夫决策过程


(8)Hadoop的Map/Reduce:

a.Map/Reduce框架运转在<key,value>键值对上

b.Map/Reduce模式的思想通过自动分割将要执行的问题(程序),拆解成Map(映射)和Reduce(化简)的方式。

在自动分割后,通过Map程序将数据映射成不相关的区块,分配(调度)给大量计算机处理达到分散运算的效果,再通过Reduce程序将结果汇整,输出开发者需要的结果。

c.Map/Reduce具有强大的并行处理能力、高容错性和封装好的错误处理

d.Map/Reduce用于处理大规模数据集(大于1TB)的并行计算





原创粉丝点击