混淆病斑样本实验

来源：互联网发布：linux http文件服务器编辑：程序博客网时间：2024/05/01 04:33

共计621副图像

根据以前的数据分类：
专家与标准相同数目:514
程序与标准相同数目:333
专家与程序相同数目:356
溃疡病判别为非溃疡病 56
非溃疡病判别为溃疡病 232

加入判别错误的样本重新训练后：
专家与标准相同数目:514
程序与标准相同数目:346
专家与程序相同数目:381
溃疡病判别为非溃疡病 2
非溃疡病判别为溃疡病 273

根据这个结果，重新加入样本训练后，得到的结果要略微好些。
但从在图像上的表现而言，识别效果却差一些。错误提取区域大量增加（将非病斑识别为病斑）。

实验数据如下：
病斑小窗口样本：16849，其中正样本5411，负样本11438
（正样本没有改变，主要是修改了负样本。负样本筛选了以前的1/2，然后新增了规模相当的负样本）

病斑样本：5111个，正样本1000个，负样本4111（在以前基础上增加了1600个负样本）

训练得到的分类器如下：
以前的分类器：小窗口分类器为500轮，病斑分类器为200轮
现在的分类器：小窗口200轮，病斑分类器500轮

我想是主要由于三个原因：
1.病斑小窗口分类器级数还不够
2.增加了病斑多样性，导致效果下降
3.提取的特征不尽合理，未能较好的表达出混淆病斑与溃疡病病斑特征

实际的瓶颈在于两个方面。第一个是样本，第二个特征。先解决样本问题：针对难以区分的混淆样本训练分类器。采取如下流程获取样本：
a.采用已经训练好的分类器对样本集进行识别(柑橘叶片样本、溃疡病样本、非溃疡病病斑样本、非病斑样本)
b.对分类结果分析，提取分类错误的样本
c.采用分类器分类错误的样本训练分类器（此时会获得非常容易混淆的样本）
d.修改样本集
e.转a，如此反复，直到训练得到理想的分类器