Lecture 1: The Learning Problem(学习问题)

来源：互联网发布：c语言中求绝对值的代码编辑：程序博客网时间：2024/06/15 08:00

Lecture 1: The Learning Problem(学习问题)

1.1 CourseIntroduction（课程介绍）

1.2WhatIs Machine Learning（什么是机器学习）

学习与机器学习：

学习：观察 -> 学习 -> 得到技能

机器学习：数据 -> 机器学习 -> 得到技能

从上述对比之中就大致可以知道什么是机器学习。学习，是通过观察、思考然后获得目标的技巧。而机器学习，则可以从学习的定义推出，机器学习，是利用已经知道的数据，找出一定的算法，从而得到目标技能。

既然人可以通过观察得到技巧，而且很多的东西我们可以写成程序，然后让机器自己运转，那为什么我们还要机器学习呢？

原因有二：

1．人虽然可以通过观察得到技巧，但是有些数据或者信息，人无法获取，可能是一些人无法识别的事物，也可能是数据过大，人工难以处理。人的处理有时候也无法满足需求，在短时间内处理大量数据是人类不能与机器相比的。

2．我们可以写出大量程序，让机器代替人快速解决问题。然而，有许许多多的东西我们是没有办法写出程序的。机器学习的两张王牌，预测（prediction）和识别（recognition）是没有可能可以写出程序来的。

使用机器学习三要素：

1. 存在一个模式或者说表现可以让我们对它进行改进提高

2. 规则并不容易那么定义

3. 有数据

1.3 Applicationof Machine Learning（机器学习的应用）

机器学习的运用是很广泛的，识别一棵树、一段话都是常见的应用。除了语音以及画面上的识别之外，机器学习也可以用作预测，预测股票走向，预测市场好坏，预测许许多多我们想要知道的东西。衣食住行，机器学习正在逐渐占领我们的生活。

1.4 Componentof Machine Learning（机器学习的组成部分）

这是第一章的重点

介绍机器学习的理论符号和数学知识。

e.g. 银行是否会给申请者发放信用卡

1.输入（input）:x∈X(每一个X中的x指银行记录里的用户信息)

2.输出（output）：y∈Y（是否会发信用卡给申请者）

3.目标函数（target function）：f:X -> Y(理想的信用卡公式)

4.数据（data），即训练样本（training function）：D={（x₁ ,y₁）…(x_n,y_n)}(银行的历史记录)

5.假设（hypothesis）：g: X -> Y（能够学习到的公式）

简单流程图：f 中的{(x_n, y_n)} -> 机器学习 -> g

机器学习，就是从我们未知、但确实存在的公式f中得到数据（即训练样本），在这些数据的基础上得到一个近似于未知公式f的公式g。

详细的机器学习流程图：

注1：

A：机器学习算法（learningalgorithm）

H：假设空间或者叫做假设集合（hypothesis set）

输入：训练样本集D、假设集合H

输出：最终假设g≈f。

注2：

A从H中挑选出它认为最好的假设作为g。

机器学习就是通过数据来得到一个假设g，假设g近似于未知的目标函数f。

1.5 MachineLearning and Other Field（机器学习与其他领域的关系）

1.5.1 ML VS DM（DataMining 数据挖掘）

数据挖掘是从大量的数据里找出有用的信息。机器学习是数据挖掘的一种重要的工具。找出的有用信息就是我们的目标函数的假设。

1.5.2 ML VS AI(Artificial Intelligence 人工智能)

人工智能是使得电脑表现出人类的智慧行为。机器学习是实现人工智能的一种方法。

1.5.3 ML VS statistic（统计）

统计是利用数据，对未知的东西进行推论。统计是实现机器学习的方法。

0 0