何谓Data Mining

来源:互联网 发布:mysql 连接时间 编辑:程序博客网 时间:2024/05/04 06:33
 
Data Mining是指找寻隐藏在数据中的讯息,如趋势(Trend)、特征(Pattern)及相关性(Relationship)的过程,也就是从数据中发掘信息或知识(有人称为Knowledge Discovery in Databases, KDD),也有人称为「数据考古学」(Data Archaeology)、「数据样型分析」(Data Pattern Analysis)或「功能相依分析」(Functional Dependency Analysis),目前已被许多研究人员视为结合数据库系统与机器学习技术的重要领域,许多产业界人士也认为此领域是一项增加各企业潜能的重要指标。此领域蓬勃发展的原因:现代的企业体经常搜集了大量数据,包括市场、客户、供货商、竞争对手以及未来趋势等重要信息,但是信息超载与无结构化,使得企业决策单位无法有效利用现存的信息,甚至使决策行为产生混乱与误用。如果能透过数据发掘技术,从巨量的数据库中,发掘出不同的信息与知识出来,作为决策支持之用,必能产生企业的竞争优势。
 
关于Data Mining
l         乐观的说法Berry and Linoff (1997)
分析报告给你后见之明(hindsight)
统计分析给你先机(foresight)
Data Mining给你识见(insight)
这三者都是在既有的数据上做分析,在概念上应该并无轩轾,差别只是手上的数据大小与性质。所以,方法不同才有定义的不同。
l         负面的定义Friedman, J. (1997)
Data mining is a commercial enterprise that seeks to mine the miners.
l         中肯的说法Hand,D.J., Blunt,G., Kelly,M.G. and Adams,N.M.
Data mining is the process of seeking interesting or valuable information in large data bases.
 
Data Mining可说会合了以下六种领域:
●Database systems, Data Warehouses, OLAP 
●Machine learning
●Statistical and data analysis methods
●Visualization
●Mathematical programming
●High performance computing
 
原创粉丝点击