数据挖掘入门

来源:互联网 发布:精准医学大数据平台 编辑:程序博客网 时间:2024/04/27 18:12

第二阶段

认识并了解数据挖掘软件StatSoft的软件Statistic,SPSS的SPSS软件,对于SAS、Clementine还没法接触,同时认识到了数理统计的重要性,并同时在自己的软件里面加入了一部分统计方面的功能,同时掌握了线性回归,非线性回归,并把非线性回归加入到软件里面,不过很可惜,对非线性回归的功能没好好利用,放在软件里面,别人还是很少用,而且这个部分的功能不象其他数理统计功能有明显的可以解释的物理意义。当时还看了一些介绍SAS软件的书,并把其中的一些功能加入到软件中去,而且对于主成分分析等两三个模式识别的算法,以及人工神经网络原理上有了了解,而且还能实现。感觉对数据挖掘有点入门,但是因为毕竟自己还是偏向于编程方面的,对于真正如何处理数据,如何进行数据挖掘,还没有一个实践方面的经验,只是理论上清楚同事处理数据的流程,还了解国外软件处理数据的流程。不过可能是处于对于化工方面的抵触,但处理化工方面的数据不感兴趣,所以还没真正从头到完处理数据的经验。既是个人原因,也是公司原因