混淆病斑样本实验

来源:互联网 发布:linux http文件服务器 编辑:程序博客网 时间:2024/05/01 04:33
共计621副图像

根据以前的数据分类:
专家与标准相同数目:514
程序与标准相同数目:333
专家与程序相同数目:356
溃疡病判别为非溃疡病 56
非溃疡病判别为溃疡病 232


加入判别错误的样本重新训练后:
专家与标准相同数目:514
程序与标准相同数目:346
专家与程序相同数目:381
溃疡病判别为非溃疡病 2
非溃疡病判别为溃疡病 273


根据这个结果,重新加入样本训练后,得到的结果要略微好些。
但从在图像上的表现而言,识别效果却差一些。错误提取区域大量增加(将非病斑识别为病斑)。

实验数据如下:
病斑小窗口样本:16849,其中正样本5411,负样本11438
(正样本没有改变,主要是修改了负样本。负样本筛选了以前的1/2,然后新增了规模相当的负样本)

病斑样本:5111个,正样本1000个,负样本4111(在以前基础上增加了1600个负样本)

训练得到的分类器如下:
以前的分类器:小窗口分类器为500轮,病斑分类器为200轮
现在的分类器:小窗口200轮,病斑分类器500轮

我想是主要由于三个原因:
1.病斑小窗口分类器级数还不够
2.增加了病斑多样性,导致效果下降
3.提取的特征不尽合理,未能较好的表达出混淆病斑与溃疡病病斑特征

实际的瓶颈在于两个方面。第一个是样本,第二个特征。先解决样本问题:针对难以区分的混淆样本训练分类器。采取如下流程获取样本:
a.采用已经训练好的分类器对样本集进行识别(柑橘叶片样本、溃疡病样本、非溃疡病病斑样本、非病斑样本)
b.对分类结果分析,提取分类错误的样本
c.采用分类器分类错误的样本训练分类器(此时会获得非常容易混淆的样本)
d.修改样本集
e.转a,如此反复,直到训练得到理想的分类器
原创粉丝点击