gcForest脑电身份识别

来源:互联网 发布:sql select 字段赋值 编辑:程序博客网 时间:2024/05/19 17:52

       上周南京大学周志华老师的论文《DeepForest: TowardsanAlternativetoDeepNeuralNetworks》源码开源了,我就下载下来按照示例调试运行一下肌电的分类程序,主要要调试数据读取程序和模型构造程序,因为我是在笔记本上运行的,所以数据量不能太大,模型也不能太复杂,每个森林下的树不能太多,我给缩小了十倍,模型深度缩小了十倍,这样才不会出现内存错误,同时数据量缩小了30倍。对训练模型的结果要自己另外设置自己的路径要不然会很麻烦,同时,训练结束之后,把结果另存,然后删除,否则在调整参数后程序会认为已经有结果文件存在,就不再按照现在的参数训练。最终得到的结果准确度为72%。

        在练习完示例之后,我尝试运用这个方法进行脑电身份识别。同样做六个人的分类,数据是网上公开的数据集,同样在笔记本上运行,所以数据量不能太大,对于一个样本的数据量太大,会造成计算量的增加,那么程序就会被进程管理器杀掉。这里我有个问题就是,对于时间序列数据,是采用多样本小数据量,还是少样本多数据量,比如我采集到的数据为每个实验对象做六个行为,每个行为70秒,我是把这70秒作为一个样本,每个实验对象有6个样本;还是把这70秒分成70份,让每个实验对象有六个行为对应70个样本,即每个实验对象有420个样本。这两种方式哪个对于深度学习更有利?  

通过训练结果可以看出少量的数据即可达到其他方法需要更多数据才能达到的效果。但是这只是在6个分类,如果分类多了之后必然不能达到这样的效果,所以还是有待验证。

原创粉丝点击