机器学习中的思考和X问题中的mind

来源：互联网发布：生化危机6优化怎么样编辑：程序博客网时间：2024/06/06 03:11

思维导图工具novanmind
2016-02-28 ccccfys cccc
使用两个快捷键inset和enter完成思维发散可视化和产品设计的必备软件

1，设想你有两种选择：可以传真一份文档，即传送图像，或者先使用光学字符阅读器（OCR），然后传送相应的文本文档。用对比方式论述两种的优缺点，并讨论什么时候一种方法比另一种方法更好？

2，假设我们正在构建一个OCR，并且我们对于每一个字符都要存储位图作为逐个像素读取字符匹配的模板，请解释什么时候这个系统会失败，？为什么条码读取器目前还在使用？

3，http://citeseer. ist. psu. edu

4，假设我们既定目标是构建垃圾邮件识别系统，请问垃圾中的什么特征让我们判断他是垃圾信息，计算机如何通过语法分析发现垃圾邮件，如果发现垃圾邮件你如何处理它，自动删除还是存在一个文件夹，还是仅仅在屏幕上闪现一下。

监督式学习
监督式学习算法包括一个目标变量（因变量）和用来预测目标变量的预测变量（自变量）。通过这些变量我们可以搭建一个模型，从而对于一个已知的预测变量值，我们可以得到对应的目标变量值。重复训练这个模型，直到它能在训练数据集上达到预定的准确度。
属于监督式学习的算法有：回归模型，决策树，随机森林，K邻近算法，逻辑回归等。
无监督式学习
与监督式学习不同的是，无监督学习中我们没有需要预测或估计的目标变量。无监督式学习是用来对总体对象进行分类的。它在根据某一指标将客户分类上有广泛应用。
属于无监督式学习的算法有：关联规则，K-means聚类算法等。
强化学习
这个算法可以训练程序做出某一决定。程序在某一情况下尝试所有的可能行动，记录不同行动的结果并试着找出最好的一次尝试来做决定。
属于这一类算法的有马尔可夫决策过程。

常见的机器学习算法
以下是最常用的机器学习算法，大部分数据问题都可以通过它们解决：

1.线性回归 (Linear Regression)
2.逻辑回归 (Logistic Regression)
3.决策树 (Decision Tree)
4.支持向量机（SVM）
5.朴素贝叶斯 (Naive Bayes)
6.K邻近算法（KNN）
7.K-均值算法（K-means）
8.随机森林 (Random Forest)
9.降低维度算法（Dimensionality Reduction Algorithms）
10.Gradient Boost和Adaboost算法

0 0