机器学习的本质是什么？

来源：互联网发布：08总决赛球员数据统计编辑：程序博客网时间：2024/04/19 14:33

著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：徐澍
链接：http://www.zhihu.com/question/19830921/answer/16294780
来源：知乎

机器学习的本质是空间搜索和函数的泛化

发布于 2013-03-0510 条评论感谢

收藏•没有帮助•

• 作者保留权利

肖淘气，可能世界的女巫

MrLeft、何史提赞同

概率加自适应

发布于 2014-10-21添加评论感谢

收藏•没有帮助•

• 作者保留权利

周弋然

leepotato赞同

归纳，预测。

发布于 2012-09-27添加评论感谢

收藏•没有帮助•

• 作者保留权利

dontbeatmycat，憋打猫猫！

刘岩、张飞路、花青松等人赞同

一般而言，机器学习方法包含以下几个组件：假设集H ：所有预测用的函数h的集合，根据其输出值，可以将问题分为回归和分类数据D：已知的数据集合，通常包含训练数据和测试数据算法A：在H中选取一个在D上表现最好的假设，在实际中，就是通过最优化理论来选择…显示全部

一般而言，机器学习方法包含以下几个组件：

假设集H ：所有预测用的函数h的集合，根据其输出值，可以将问题分为回归和分类
数据D：已知的数据集合，通常包含训练数据和测试数据
算法A：在H中选取一个在D上表现最好的假设，在实际中，就是通过最优化理论来选择模型参数。
VC bound ：在训练数据和测试数据从同一个概率分布抽取，且数据量够大时时，对于常见的 error measure（0/1 error, square error 等），h在训练数据上的表现与在测试数据上的表现接近，于是我们可以通过最小化训练数据上 error 来最小化在整个数据分布上的 error。

不管机器学习算法怎么变，这些组件都差不多，我认为它们就是机器学习的本质。
===================
以上回答是我年轻时的不成熟的想法，更准确地说，这是 frequentist 观点下的机器学习。

编辑于 2015-07-051 条评论感谢

收藏•没有帮助•

• 作者保留权利

贺照人，计量生物学砖工

贝壳、陈鑫、Genkun Abe 等人赞同

机器学习和生物学习的过程本质上应该是一样的。我认为本质都是映射。就是建立输入输出的函数关系，只不过一个自然系统，比如人脑，能够进行规模庞大的并行运算，从输入中滤去noise，抽取feature（人脑神经元本身就是非线性计算单元，而且数量在10^11-10^12…显示全部

机器学习和生物学习的过程本质上应该是一样的。

我认为本质都是映射。就是建立输入输出的函数关系，只不过一个自然系统，比如人脑，能够进行规模庞大的并行运算，从输入中滤去noise，抽取feature（人脑神经元本身就是非线性计算单元，而且数量在10^11-10^12），而现行的机器学习程序没办法建立这么复杂的映射关系。

举个例子，比如人看见东西，也无非就是视网膜接受信号，传递到LGN再到primary vision cortex再到侧叶和顶叶的高级视觉处理中心，这样一层一层的feature抽取过程，之后这些激活的feature再与高级认知活动相互作用，建立从输入（视觉刺激）到输出（物体认知）的映射关系。只不过这个映射的输入向量维度为10^8（人眼大概有这么多视网膜柱/锥细胞），比机器学习平常能处理的维度高不少。

发布于 2012-11-237 条评论感谢

收藏•没有帮助•

• 作者保留权利

王晓宇

静远、戴佳洁、Ice And Fire赞同

机器学习的本质我认为应该是model，真实世界是复杂的，但是目前为止没有一个简单的model能把真实世界抽象出来（这只能用“混沌”来理解吧），即使是对于某个特定的问题，也没有一个能100%抽象它的model，因为问题之间往往是联系的，即使我们找到了一个完美…显示全部

机器学习的本质我认为应该是model，真实世界是复杂的，但是目前为止没有一个简单的model能把真实世界抽象出来（这只能用“混沌”来理解吧），即使是对于某个特定的问题，也没有一个能100%抽象它的model，因为问题之间往往是联系的，即使我们找到了一个完美的model来解释某个问题，但是因为其它问题的干扰，从实际效果（或者说数据）的角度来看可能也并不完美，可能只有70-80%的数据符合这一model。
那么好吧，我们为什么要找一个最真实的模型呢？我们只要能用这个model在给定范围内能以解决问题就够了。于是，就出现了各种尽量简单（为了便于应用）但应用范围特定的model，在同一类问题的不同环境下，影响因素可能有不同，于是我们用参数来描述不同的外部影响因子，一个model就可以通过特定数量的参数得到唯一描述。为了确定这个model，也就是那些影响因子，我们才会通过机器学习的方法以及数据来认知。
所以data只是机器学习这个过程的外部表现，谈不上本质。
而统计是方法，是手段。我们大多是通过 数据->统计,贝叶斯->model 这样一条路来进行机器学习的。

发布于 2013-03-05添加评论感谢

收藏•没有帮助•

• 作者保留权利

谢天，机器学习爱好者，NumPy

徐宁、Brian XIE、Terry Meng赞同

我偷换下问题吧。因为我不知道本质这个词是什么意思。换成我们为什么需要机器学习？为什么我们现在需要了？其实以前我们就需要，统计学发展出来就是为大量的数据处理服务的。我们人类的大脑在进化过程中面对的环境相对于今天的数据量来讲是简单的，而且绝大…显示全部

我偷换下问题吧。因为我不知道本质这个词是什么意思。
换成我们为什么需要机器学习？
为什么我们现在需要了？
其实以前我们就需要，统计学发展出来就是为大量的数据处理服务的。
我们人类的大脑在进化过程中面对的环境相对于今天的数据量来讲是简单的，而且绝大多数时候决策空间都是两元的，如能吃或不能吃，逃或追，睡或不睡，相信或不信等等。
决策参考的变量基本都在10个以内，所以人类连文字都不需要也能过个几十万年。
人口密集，商业发展之后，数据量扶摇直上。
不写下来大脑根本扛不住。
今天的机器学习跟当年的文字和记账系统没有太多区别。
都是解决决策所需要的数据量超过我们有限大脑的处理能力的问题。
所以我们需要
1.机器把数据整理成我们能理解的形式（可视化）
2.机器根据数据和目标来简化决策选项。
机器学习带来的好处就是人还是干人擅长的事情，即决定目标。
机器把2-3个好的选项提供给我们。

发布于 2014-08-311 条评论感谢

收藏•没有帮助•

• 作者保留权利

张涵，NLP/ML小渣子+O2O脑残粉

李四、Lingpeng Kong赞同

个人浅见，机器学习这个叫法是从监督学习里来的。对于监督学习，我感觉和人类学习的思维方式比较相近，就像你教小孩，这个是妈妈，那个是爸爸，其他人是叔叔阿姨，这就就是training data，然后就是一个分类问题。至于小孩怎样去区分爸爸妈妈和其他人就是模…显示全部

个人浅见，机器学习这个叫法是从监督学习里来的。对于监督学习，我感觉和人类学习的思维方式比较相近，就像你教小孩，这个是妈妈，那个是爸爸，其他人是叔叔阿姨，这就就是training data，然后就是一个分类问题。至于小孩怎样去区分爸爸妈妈和其他人就是模型的问题了。

发布于 2014-06-182 条评论感谢

收藏•没有帮助•

• 作者保留权利

unknownknown，小王纸

请移步这里，什么是机器学习？什么是机器学习？什么是机器学习？

请移步这里，
什么是机器学习？
什么是机器学习？
什么是机器学习？

编辑于 2015-08-31添加评论感谢

收藏•没有帮助•

• 作者保留权利

张季伦，业余机器学习爱好者

李瑞安、白leo、刷刷等人赞同

//于2014 10 20 重排格式对这个问题谈一点自己的看法：要回答机器学习的本质，需要几个不同的角度来看： 1）机器学习所解决的问题。 2）机器学习所使用的方法。 3）机器学习的相似领域。（第三点看似和前两点不和，但是要结合第二点讨论）。/**************…显示全部

//于2014 10 20 重排格式
对这个问题谈一点自己的看法：
要回答机器学习的本质，需要几个不同的角度来看：

1）机器学习所解决的问题。
2）机器学习所使用的方法。
3）机器学习的相似领域。（第三点看似和前两点不和，但是要结合第二点讨论）。

/*******************************分割线***********************************/

我对这以上三个角度的见解：
1）机器学习解决的问题概括的讲，就是模糊的，不确定的问题；
比如说要计算机去做上千亿上万亿次四则运算，要去做一个排序或者选择，哪怕数据很大很精细，但这样的问题也是不需要用到机器学习的，因为这种问题本身是确定的，这种确定往往分两个方面：a）元方法的确定。b）计算目的的确定，或者说是算法结果的确定。
而机器学习不同，机器学习解决的问题和智慧生物解决的很多问题相似，比如说：分类、关联、归纳、总结决策，如果我们要让计算机去分辨水果的种类，去预测疾病的发病率，这些问题就需要机器学习做了，回到刚才那两个方面，对于机器学习（模糊计算问题）来说：a）元方法不确定，对于分类，有很多截然不同的思维方法，这些思维方法的不同源于对于智慧生物分类算法的模拟不同，不像诸如排序算法，其本质大多基于对于给定模型的二分决策流程。b）计算目的不确定，这里说的计算目的不确定，往往是说你基于某种机器学习算法的某种机器学习任务的模型是不确定的，比如说你要分类，但是这时候谈的不仅仅是分类这个领域了，而是基于你这个数据集上的这种机器学习分类算法上加上这样的参数的分类任务了，貌似和前面一点有点相似，但是不同的地方更多一些。
再之，机器学习任务所期望的目标（结果）往往是动态的，比如说某些机器学习任务要求你给一个预测疾病的模型（注意：其实你这个机器学习的任务是“给出模型”，通过这个模型再预测具体的疾病实例是后来的事情了，于是对于计算这个模型，往往再机器学习任务的几个阶段对其的要求是不同的，随着机器学习对于训练样例的分析和计算，可能你这个模型时时刻刻都在变，以前那个模型预测不发病的测试样例可能用现在这个模型变得要发病了）；而非机器学习任务却不然，比如排序，不管你的数据怎么变，你排序的“模型”还是基于布尔或者多值的决策的，是不会变的。讨论这一点，是为了说明，有一些看来不是“模糊不确定问题”的问题为什么也要用机器学习来解决，预测疾病是模糊的，但是比如搜索引擎的搜索排名（所谓的Rank问题）其实看来应该是一个简单的“排序”问题，但是却有很多公司用机器学习做，原因是对于解决这种“网页网站排序”的模型是在变的，归根结底还是期望的目标在变得。

2）要机器学习所使用的方法；
由于上一点谈到元方法的不确定，所以，虽然机器学习要解决的任务与智慧生物解决的问题相似，但未必机器学习算法底层上所使用的计算思维和智慧生物是相似的，当然，机器学习和智慧生物在解决问题的宏观层面是一致的，比如强化学习，监督和非监督学习，这些思维是一致的。机器学习算法在底层上可能更多得用到统计学或者概率分布上的一些基本方法。比如贝叶斯，比如所谓的一些分类方法大多数是基于训练样例的概率分布来计算的。

3）机器学习和其他领域的交叉；
简单的说：机器学习可以大约的解释成数据挖掘+人工智能，数据挖掘所描述的是机器学习偏统计，偏数学的一部分；人工智能说的是机器学习偏仿生的一部分。

/********************************综上***********************************/

机器学习就是：利用统计方法或者其他数学方法，模拟智慧生物解决问题流程（注意，是流程不是方法），解决模糊模型或者模糊决策问题啦。

编辑于 2014-10-201 条评论感谢

收藏•没有帮助•

• 作者保留权利

乎知，关注Machine Learning,对心理学、经济学…

徐宁、何星宇、18601298928 等人赞同

本质来说就是用数据猜测一个复杂函数，由模型复杂程度决定函数复杂程度，对于模型参数求解设计到优化问题

发布于 2014-03-011 条评论感谢

收藏•没有帮助•

• 作者保留权利

甄景贤

徐宁、花青松、孙悦赞同

通常有个「假设空间，hypothesis space」，而我们在这空间中搜寻最好的假设。「最好」的意思是，那假设最符合已给出的资料 (input data)。例如「有鬍子 → 是爸爸」是一个假设 (hypothesis)，有些婴孩会犯这错误。在统计学习中的假设，可能是某个空间中的几…显示全部

通常有个「假设空间，hypothesis space」，而我们在这空间中搜寻最好的假设。

「最好」的意思是，那假设最符合已给出的资料 (input data)。

例如「有鬍子 → 是爸爸」是一个假设 (hypothesis)，有些婴孩会犯这错误。

在统计学习中的假设，可能是某个空间中的几何分割，每个分割是一个假设，由若干参数 (parameters) 给出。

可以看看我写的这篇博客短文：
什么是机器学习？

编辑于 2015-06-102 条评论感谢

收藏•没有帮助•

• 作者保留权利

何史提，DIKW金字塔底层民工

王希文、林璐、xiaoh 等人赞同

统计（statistics）和最优化（optimization）

发布于 2014-10-201 条评论感谢

收藏•没有帮助•

• 作者保留权利

王函，生物信息硕士，数据挖掘及算法工程师@Ali…

余霆嵩、AESIR、刷刷等人赞同

目前的机器学习往大了说分两种，有监督和无监督学习。有监督学习，从机器的角度来说，它是被动的。就是需要人来“教授”，所以需要人来告诉机器一个前提，例如：人要吃饭，那么通过后期的机器学习，机器可以告诉我们，什么样的人爱吃什么样的饭，吃咖喱饭的…显示全部

目前的机器学习往大了说分两种，有监督和无监督学习。

有监督学习，从机器的角度来说，它是被动的。就是需要人来“教授”，所以需要人来告诉机器一个前提，例如：人要吃饭，那么通过后期的机器学习，机器可以告诉我们，什么样的人爱吃什么样的饭，吃咖喱饭的人又有什么性格等等。但是如果没有人的干预，来告诉机器人要吃饭的话，机器现在是不具备主动学习能力的。

无监督学习，从机器的角度来说，它是主动的，它需要观察很多的数据。例如你把机器人放到餐馆里，他观察一段时间后，可以发现，人是需要吃饭的。然后可以得出很多结论，例如上面所说的。但是会得到更多结果，例如人们大都几点来吃饭，这个时间来吃饭的人会是什么职业等等。比上面得到的结论更多。

总体来说，机器学习，就是通过各种算法发现规律，然后这些规律的集合就是模型，输入数据按照模型得到的结果，就是机器学习的结果，结果可以分为分类结果，聚类结果，预测结果等等。

核心还是统计和信息论的一些东西。

发布于 2013-03-05添加评论感谢

收藏•没有帮助•

• 作者保留权利

iamsile，算法工程师

静远、余霆嵩赞同

寻找最优的函数去拟合数据，既不过拟合，也不欠拟合.寻找更好的数学方法去表达抽象事物。

发布于 2014-07-05添加评论感谢

收藏•没有帮助•

• 作者保留权利

夏飞，软件学院学生

Ivan Siu、陈亿沛、吴文捷等人赞同

本质是统计学习！（虽然我知道有的人可能不同意，但是我确实这样认为）

发布于 2012-10-258 条评论感谢

收藏•没有帮助•

• 作者保留权利

Feifei

李立、陈北空、李赫等人赞同

learning=representation+evaluation+optimization手头的paper《a few things to know about machine learning》---pedro domingos正文第一大标题

learning=representation+evaluation+optimization

手头的paper《a few things to know about machine learning》---pedro domingos正文第一大标题

发布于 2014-10-231 条评论感谢

收藏•没有帮助•

• 作者保留权利

泰一，

优化算法之一，至于名字中学习二字是营销驱动的结果。

发布于 2015-10-14添加评论感谢

收藏•没有帮助•

• 作者保留权利

Twisted Python，热爱Python，Data Debugger，机器学习进…

张子游、走刀口赞同

Function Approximation

发布于 2014-10-19添加评论感谢

收藏•没有帮助•

• 作者保留权利

徐宁赞同

本质是求解分类函数f(x)，f(x)太复杂没法用代数方法求，一般是用一个给定的模型去拟合训练集

发布于 2014-01-16添加评论感谢

收藏•没有帮助•

• 作者保留权利

一休，just do it

Vraena赞同

特征+模型

发布于 2014-03-121 条评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

张驰赞同

CS里的中医

发布于 2015-08-02添加评论感谢

收藏•没有帮助•

• 作者保留权利

marsxiang，无止境追寻更美好的自己

成冬、zeroooo、羊羽s 等人赞同

机器学习本质就是计算机自动获取知识，它是知识工程的三个分支（使用知识、表示知识、获取知识）之一。当前人工智能研究的主要障碍和发展方向之一就是机器学习，这包括发展学习的计算理论和构造学习系统，现在的人工智能系统还完全没有或仅有很有限的学习能力…显示全部

机器学习本质就是计算机自动获取知识，它是知识工程的三个分支（使用知识、表示知识、获取知识）之一。

当前人工智能研究的主要障碍和发展方向之一就是机器学习，这包括发展学习的计算理论和构造学习系统，现在的人工智能系统还完全没有或仅有很有限的学习能力。系统中的知识由人工编程送入系统，知识中的错误也不能自动改正。

未来的计算机将有自动获取知识的能力。它们直接由书本学习，通过与人谈话学习，通过观察环境学习。它们通过实践自我完善，克服人的局限性，例如存储量少、效率低、注意力分散和难以传送所获取的知识，一台计算机获取的知识很容易复制给任何其它机器。

现有的程序已经可以形成新概念和发现数据中的规律，可以产生决策规则，可以提取类比，可以学习问题求解的启发式，可以产生一般的规划。现在还不清楚用现有的硬件和编程方法可以使机器学习达到什么水平，这可能让机器超出人类控制，从而产生不可预料的危险。

机器学习的难点在于：
首先，学习系统性能的预测将更加困难。学习系统产生的知识可能使系统建造者都无法预料。如果用这种系统解决重要问题，就可能产生意外的困难或危险。

其次，获取的知识本质上还是猜想。由特定的观察和类比生成的知识不可能证明其正确性。归纳推理不是保真的，它是保假的。演绎推理才是保真的。例如，由"所有鸟都是动物"推出"麻雀是动物"。这是演绎推理，前提真结论必真。又如，"麻雀会飞"推出"所有鸟都会飞"。这是归纳推理，前提真结论不一定真（如驼鸟是鸟但不会飞）。再如，"麻雀是植物"推出"所有鸟都是植物"。前提假结论必假，这是归纳推理的保假性。此外，对给定的前提，理论上存在无限多归纳结论。在归纳中依据倾向性、假设和约束考虑其中少数结论。因此在归纳中要使用人类的假设和约束。机器不可能具有人类的所有假设和约束，因此机器生成的知识就会违背人的约束。为了产生新知识，需要觉察到什么是重要的、什么是有意义的。机器的这种能力比人差得多。

以上只是大致说明了下机器学习是啥，现在这个研究，也远远没有成熟和达到可以毫无顾虑的使用的程度，这是一个很有意思的领域，有极大可能，是续信息革命后人类又一次革命的开端，智能革命。

编辑于 2013-03-051 条评论感谢

收藏•没有帮助•

• 作者保留权利

范佳炜，电子商务，数据分析

来三虎赞同

数据的结构决定数据的作用，机器学习试图发现数据的结构，因此MDL的描述与此是相通的。

发布于 2012-10-251 条评论感谢

收藏•没有帮助•

• 作者保留权利

songzw，.

Noyi赞同

寻找和建立规则

发布于 2014-04-18添加评论感谢

收藏•没有帮助•

• 作者保留权利

笼中人

用逻辑来建立机器学习的概念是愚蠢的。最终的人工智能是独立于人类的单独物种，根据物种起源来看，他比人类更适合那个时代的生存。

发布于 2014-01-02添加评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

模仿人某一方面能力可以理解为从输入到输出的关联的能力主要相关的东西是：最优化理论和统计学、概率论。哦，还有搜索相关的如动态规划

模仿人某一方面能力
可以理解为从输入到输出的关联的能力
主要相关的东西是：最优化理论和统计学、概率论。哦，还有搜索相关的如动态规划

发布于 2014-02-28添加评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

我觉得还是大部分是以统计学习方法的为主，目前还是以监督学习的模型居多

发布于 2014-04-16添加评论感谢

收藏•没有帮助•

• 作者保留权利

小明

现阶段的机器学习基本都是基于数理统计理论（当然还包括很多其他数学理论）的数学模型推导。从朴素贝叶斯、回归分析、决策树，到神经网络，都是数学模型的映射。在将来，仿生技术牛逼了以后，说不定机器学习会真正的脱离狭义数理模型，真正的变成生物机器神…显示全部

现阶段的机器学习基本都是基于数理统计理论（当然还包括很多其他数学理论）的数学模型推导。从朴素贝叶斯、回归分析、决策树，到神经网络，都是数学模型的映射。在将来，仿生技术牛逼了以后，说不定机器学习会真正的脱离狭义数理模型，真正的变成生物机器神经的自主学习（就像人类大脑一样）。

编辑于 2014-05-11添加评论感谢

收藏•没有帮助•

• 作者保留权利

我觉得非常像记忆化搜索动态规划跟搜索的杂交变种。。。。。。。。。。。。。

我觉得非常像记忆化搜索
动态规划跟搜索的杂交变种。。。。。。。。。。。。。

发布于 2014-10-12添加评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

数据预处理，参数微调和feature engineering

发布于 2014-10-19添加评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

本质是生物学/哲学。但现行的ML嘛..............那就统计学咯~

本质是生物学/哲学。

但现行的ML嘛..............那就统计学咯~

发布于 2014-10-19添加评论感谢

收藏•没有帮助•

• 作者保留权利

剑雨花，肤白貌美

jing guo，博、杂、乱

这么开放性的问题也留个脚印吧。机器学习的本质就是把人的重复工作规范化（好空啊，本来是想用这个东西来说算法的），言外之意是你没办法把一个你自己都理解不了的东西来扔给机器去理解。想一个人的理解大部分是基于统计的（我猜的，慢喷）。所谓我们孰能生…显示全部

这么开放性的问题也留个脚印吧。机器学习的本质就是把人的重复工作规范化（好空啊，本来是想用这个东西来说算法的），言外之意是你没办法把一个你自己都理解不了的东西来扔给机器去理解。
想一个人的理解大部分是基于统计的（我猜的，慢喷）。所谓我们孰能生巧的过程，在机器来做就是看一条一条的数据；放给你，把一件事情做到50次才能到熟练的程度，而给机器则是50条数据，然后用一个函数来整合/表示所有的环节（所谓的属性），最后得到一个好或不好的判断，就相当于机器在学习。
话痨一点的例子说，一件事，包括3个环节，每个环节都做好才能得到最终一个满意的结果。给人看，多试几次差不多可以知道每个环节要做成什么样子。给机器则是给每个环节分配一个阈值，看最后加权得到的分数，高于多少分就是好。

发布于 2015-03-14添加评论感谢

收藏•没有帮助•

• 作者保留权利

苹果的味道，Winter Coming!

本质就是:学什么，为什么能学，怎么学，怎么学更好！

本质就是:
学什么，为什么能学，怎么学，怎么学更好！

发布于 2015-03-17添加评论感谢

收藏•没有帮助•

• 作者保留权利

dao wang

让机器知道向人一样，可以自主学习

发布于 2015-04-12添加评论感谢

收藏•没有帮助•

• 作者保留权利

最近我也一直在看机器学习这本书，个人认为并不是机器可以完全替代人类去做所有的事情，至少在模型生成之前得靠人去收集并抽取数据特征，并且算法的选择也得靠个人去决定。然而一旦当模型生成之后，在某种程度上而言，机器并可以代替个人去告诉我们某个事情…显示全部

最近我也一直在看机器学习这本书，个人认为并不是机器可以完全替代人类去做所有的事情，至少在模型生成之前得靠人去收集并抽取数据特征，并且算法的选择也得靠个人去决定。然而一旦当模型生成之后，在某种程度上而言，机器并可以代替个人去告诉我们某个事情的分类结果到底是什么了。

发布于 2015-08-09添加评论感谢

收藏•没有帮助•

• 作者保留权利

余霆嵩

就字面意思，机器学习，就是使得机器去学到我们想让TA（机器）去学到的某种东西（这种东西可以理解为复杂的function，）。然后我们去使用这种东西。从技术层面，机器学习就太广泛了，涉及的学科太多。所以请自行搜索一下，了解了解。

就字面意思，机器学习，就是使得机器去学到我们想让TA（机器）去学到的某种东西（这种东西可以理解为复杂的function，）。然后我们去使用这种东西。
从技术层面，机器学习就太广泛了，涉及的学科太多。所以请自行搜索一下，了解了解。

发布于 2015-08-29添加评论感谢

收藏•没有帮助•

• 禁止转载

王轶楠，统计学习/基因组学

对于监督学习，在训练集、验证集以及测试集来自同一分布的假设下寻找一个函数来拟合数据的分布。

发布于 2015-08-29添加评论感谢

收藏•没有帮助•

• 作者保留权利

普佳萌，没，没有人仰慕，那我就继续忙碌

cost function建模调整优化data sample自动搜索全局最优化值

阿诺斯瓦哈密瓜，再见，知乎

结构风险最小化。让模型最好地来表示数据的分布，使得误差/风险最小。

结构风险最小化。
让模型最好地来表示数据的分布，使得误差/风险最小。

发布于 2014-10-24添加评论感谢

收藏•没有帮助•

• 作者保留权利

匿名用户

follow the rules1，遵循基本规则筛选。2，以多种复杂函数（二次筛选规则）进行二次筛选。3，找寻筛选目标间的联系并建立相对应的规则。4，实验规则。5，实验规则结果大于某一数值时可将规则加入基本规则（与现有规则冲突时roll点进行筛选）实验规则结果如…显示全部

follow the rules

1，遵循基本规则筛选。
2，以多种复杂函数（二次筛选规则）进行二次筛选。
3，找寻筛选目标间的联系并建立相对应的规则。
4，实验规则。
5，实验规则结果大于某一数值时可将规则加入基本规则（与现有规则冲突时roll点进行筛选）
实验规则结果如果小于前一数值且大于某一数值可将其加入二次筛选规则，
实验规则结果如果小于某一数值可随机减少二次筛选规则进行重复筛选。

哈哈这是我瞎编的，如果觉得有用就折叠吧+“+

0 0

机器学习的本质是什么？

肖淘气，可能世界的女巫

周弋然

dontbeatmycat，憋打猫猫！

贺照人，计量生物学 砖工

王晓宇

谢 天，机器学习爱好者，NumPy

张涵，NLP/ML小渣子+O2O脑残粉

unknownknown，小王纸

张季伦，业余机器学习爱好者

乎知，关注Machine Learning,对心理学、经济学…

甄景贤

何史提，DIKW金字塔底层民工

王函，生物信息硕士，数据挖掘及算法工程师@Ali…

iamsile，算法工程师

夏飞，软件学院学生

Feifei

泰一，

Twisted Python，热爱Python，Data Debugger，机器学习进…

匿名用户

Eastdog，资深红烧肉爱好者

Rancho-Fang，想象中思考

王昭君，工科屌丝丝

Brian，没有，没有，还是没有

木有

一休，just do it

匿名用户

marsxiang，无止境追寻更美好的自己

范佳炜，电子商务，数据分析

songzw，.

笼中人

匿名用户

匿名用户

小明

地球转不转

李鹏翔，除了C什么都不会

Liu Lubor，Master in ML/DM.

宋子文晗，码的不是代码，是草泥马

听雨，南无金刚坚强消伏坏散如来 南无妙功德住…

匿名用户

匿名用户

剑雨花，肤白貌美

jing guo，博、杂、乱

苹果的味道，Winter Coming!

dao wang

沈徍麒，提问欠思考和欠自洽得不可忍受unbearably…

楚权

Joshua Zhang，数据库不能得出结论

戴敏，becoming a computational biologist

不带毛的兔子

余霆嵩

王轶楠，统计学习/基因组学

普佳萌，没，没有人仰慕，那我就继续忙碌

烦恼是什么颜色，在读博士

匿名用户

冯锦旗，总是容易被往事打动。

viekie，机器学习爱好者

张理良，追求多元思维

阿诺斯瓦哈密瓜，再见，知乎

匿名用户

贺照人，计量生物学砖工

谢天，机器学习爱好者，NumPy

听雨，南无金刚坚强消伏坏散如来南无妙功德住…