机器学习笔试

来源：互联网发布：怎么查看手机端口号编辑：程序博客网时间：2024/06/08 10:24

（1）自然条件下，使熵最大化的数据分布形式是均匀分布

熵越大越混乱，而越均匀代表越无序，也就是越混乱

（2）贝叶斯定理表达式：P（A|B）=P（B|A）P(A)/P(B)

（3）机器学习五大流派：进化学派、联结学派、符号学派、贝叶斯派、类推学派。知识点链接

（4）如果一个神经网络用于预测一种事物的分类，例如分为A、B、C、D四类，那么下列哪一个激活函数适用于该神经网络的输出层：Softmax

Relu一般用于隐含层的激活，而TanH和Sigmoid太慢；输出层：如果是分类则用Softmax，回归则用Linear。知识点链接

（5）a.矩阵的特征值揭示了矩阵包含的信息量

（特征值越大，说明矩阵在对应的特征向量上的方差越大，概率越大，信息量越多）

b.矩阵行满秩即行向量线性无关

d.矩阵的行秩和列秩总是相等

（6）a.卷积神经网络一般用于图像处理等局部特征相关的数据

b.强化学习以输入数据作为对模型的反馈

c.监督学习和非监督学习的区别在于是否要求样本数据带标签

（7）机器学习算法属于监督学习的是：SVM、朴素贝叶斯、线性回归等。

a.监督式学习算法：回归模型、决策树、随机森林、K邻近（KNN）算法、逻辑回归等。知识点链接

b.无监督式学习算法：关联规则、K-means聚类算法等

c.强化学习：马尔可夫决策过程

（8）Hadoop的Map/Reduce：

a.Map/Reduce框架运转在<key，value>键值对上

b.Map/Reduce模式的思想通过自动分割将要执行的问题（程序），拆解成Map（映射）和Reduce（化简）的方式。

在自动分割后，通过Map程序将数据映射成不相关的区块，分配（调度）给大量计算机处理达到分散运算的效果，再通过Reduce程序将结果汇整，输出开发者需要的结果。

c.Map/Reduce具有强大的并行处理能力、高容错性和封装好的错误处理

d.Map/Reduce用于处理大规模数据集（大于1TB）的并行计算

阅读全文

0 0