《模式识别与智能计算-matlab技术实现》学习笔记二

来源:互联网 发布:办公软件使用技巧 编辑:程序博客网 时间:2024/05/18 09:39

1.1模式识别的基本概念

   1.模式的描述方法

    一个待分类的对象就是一个样本。

    必须确定一些与识别有关的因素作为分类研究的根据,每一个因素成为一个特征;模式就是样品所具有特征的描述。

    模式中抽取的多个特征的特征集可用特征向量表示;特征向量的每个元素就特征。

    模式识别问题,就是根据模式的特征集,即特征向量X中的n个特征来判别模式属于几个特定类中的哪一类。 

2.模式识别系统

    典型的模式识别系统,由数据获取、预处理、特征提取、分类决策及分类器设计五部分组成。 

数据获取:

用计算机可运算的符号表示研究对象,一般有以下数据类型:

1)二维图像:文字、指纹、地图、照片等;

2)一维波形:脑电图、心电图、季节震动波形等;

3)物理参量和逻辑值:体温、化验数据、参量正常与否的描述。 

预处理:

对输入测量仪器或其他因素所造成的退化现象进行复原、去噪声,提取有用信息。 

特征提取和选择:

提取,是对原始数据进行变换,得到最能反映分类本质的特征;

选择,是将高纬测量空间(原始数据组成的空间)转变为低纬特征空间(分类识别可进行的空间)。 

分类决策:

在特征空间中用模式识别方法把样本归为某一类别。 

分类器设计:

在样本训练集基础上确定判别函数,改进判别函数和误差检验。

 

3.统计识别研究的主要问题

1)特征的选取与优化

2)分类判别:有监督学习方法;

3)聚类判别:非监督学习方法;

 

1.2特征空间优化设计问题

1.特征选择

    指针对原始数据进行抽取,抽取那些对区别不同类别最为重要的特征,而舍去那些对分类并无多大贡献的特征,得到能反映分类本质的特征。

    对一个模式类特征选择的好坏,很难再实现完全预测,只能针对整体分类识别系统获得的分类结果给予评价。

   Kanal.L总结过:样本量N与特征数n之比应该足够大,通常样本量N是特征数n的5-10倍左右。

    特征选择通常包括两方面:

    一、对单个特征的选择;

    二、从大量原有特征出发构造出少数的有效新特征,这种方法成为降维映射。

    对具体问题,有以下两个不同层次:

    一、物理量的获取与转换:传感器获取电信号,并对其进行降噪、加工等处理。

    二、描述事物方法的选择与设计:怎样表现模式特征。 

2.特征提取

    (这里没明白与上面的明确区别……)

0 0
原创粉丝点击