最近修改代码(Matlab)的感受

来源:互联网 发布:注册公司流程 知乎 编辑:程序博客网 时间:2024/04/27 23:00

     最近又对以前写过的柑橘溃疡病检测的代码作了很大的调整。主要集中在三个方面:分解功能模块、统一命名方式与调用方式、循环修改为矩阵运算。

     记录一些感受。望自己以后多加注意。

1、不要 在一个函数中集中太多的功能;如果功能模块能分解,那么,就尽最大努力的分解;函数功能愈单一愈好

         功能模块分解后能够最大限度的提高代码复用;

        调试时也方便许多

2、不要使模块过度灵活或者过度复杂;应该在灵活性与复杂度之间取一个合适的平衡;

        与第一个问题似乎差不多

        有一个时间段,总喜欢将函数做的非常复杂,希望能够完成好几种类似的功能;每次都采用matlab变参实现,变参多了,使得函数变得非常难以理解。

        比如,一个 AdaBoost  函数,它需要完成 AdaBoost 按轮数训练、AdaBoost 按特征数、AdaBoost 测试、同时训练并测试等类似的功能;以前做的就是把所有功能集成在一起;在现在看来,这是一个非常烂的设计。调试困难,调用时无法通过函数名知道其所需要的功能;并且,代码重用非常困难。

       在上一次的代码重构中,已经将这些分解了。但分解了仍然不够彻底。现在这个函数已经拆成七八块了。

       AdaBoostClassfy                     AdaBoost 强分类器对一组样本进行分类
       AdaBoostWeakLearnerClassfy AdaBoost弱分类器对一组样本进行分类
       searchBestWeakLearner      在特征列上获得最优的阈值分类器
       trainAdaBoostClassifier        在训练集上训练 AdaBoost 分类器
       testAdaBoostClassifier         在测试集上测试 AdaBoost 分类器
       testAdaBoost(训练与测试)    将样本随机划分为训练集与测试集,多次训练测试AdaBoost分类器
       AdaBoost(训练与测试)           给定训练集与测试集,训练测试AdaBoost分类器
 
       testAdaBoost 与 AdaBoost 类似,均是先训练分类器,而后测试分类器
       testAdaBoost 测试多次,并且将样本集分为训练集与测试集
       testAdaBoost 通过调用 AdaBoost 函数实现多次的分类器训练与测试
       AdaBoost调用 trainAdaBoostClassifier 训练, 调用 testAdaBoostClassifier 进行测试

      目前的设计不仅没有任何的重复代码,并且可扩充性也强许多。目前看来,还算一个不错的设计了。也许几个月后看,还存在许多问题。到时候再来解决吧。

3、形成一个习惯的命名方式,并严格执行

       变量命名:尽量采用全名

                           复杂对象(向量、矩阵、结构体、cell)首字母大写

                           简单变量(int,double)之类,首字母小写

                        比如:Samples      待分类的样本, cntSamples x cntFeatures 矩阵

                                       boostthresh  AdaBoost强分类器的阈值,默认为0.5

                         同一类型的变量采用同样的命名,比如数量前加:cnt,比如,

                                            样本数量:cntSamples  ;特征数量 cntFeatures 

      函数命名:  动词+名词 方式,尽量采用全名

                   比如:searchBestWeakLearner  在特征列上获得最优的阈值分类器 

                               trainAdaBoostClassifier    训练AdaBoost分类器

    统一命名方式后,结合注释,代码的可读性会大大提高。

4、循环尽量改为矩阵操作

         采用矩阵操作后代码会简洁许多,但会变得很难理解。需要增加注释,方便理解。 

5、归结几点:

      在完成功能的基础上

      可读性第一:就是要有良好的代码风格,比如注释良好而丰富、命名易理解、使用变量替换常数、代码缩进、不要写太长的嵌套调用、相关代码集中,等等等等

      可扩展性第二:变参需适量控制;函数功能单一;

      性能第三:最后考虑性能,matlab里面尽量采用矩阵替换循环

       

   

       血的教训!!多加注意!!!!!!!

       还约需要2.5周才能完成代码重构,任重而道远!!

原创粉丝点击