PMML(一):初探

来源:互联网 发布:ubuntu 禁用guest 编辑:程序博客网 时间:2024/06/06 11:34

1.简介

PMML全称预言模型标记语言(Predictive Model Markup Language),利用XML描述和存储数据挖掘模型,是一个已经被W3C所接受的标准。MML是一种基于XML的语言,用来定义预言模型。它为各个公司定义预言模型和在不同的应用程序之间共享模型提供了一种快速并且简单的方式。通过使用标准的XML解析器对PMML进行解析,应用程序能够决定模型输入和输出的数据类型,模型详细的格式,并且按照标准的数据挖掘术语来解释模型的结果。 PMML提供了一个灵活机制来定义预言模型的模式,同时支持涉及多个预言模型的模型选择和模型平衡(model averaging)。对于那些需要全部学习(ensemble learning)、部分学习(partitioned learning)和分布式学习(distributed learning)的应用程序,这种语言被证明是非常有用的。另外,它使得在不同的应用程序和系统之间移动预言模型变得容易、方便。特别地,PMML非常适合部分学习、元学习、分布式学习、以及相关领域。

PMML(Predictive Model Markup Language) 是一个开放的工业标准,它以 XML 为载体将数据挖掘任务标准化,可以把某一产品所创建的数据挖掘方

案应用于任何其它遵从 PMML 标准的产品或平台中 , 而不需考虑分析和预测过程中的具体实现细节。使得模型的部署摆脱了模型开发和产品整合的束缚,为商业智能产品、数据仓库和云计算中的数据挖掘模型的应用环境开拓了新的篇章。

2. 组成部分

头文件,数据模式,数据挖掘模式,预言模型模式,预言模型定义,全体模型定义,选择与联合模型和全体模型的规则,异常处理规则
其中,预言模型的模式和预言模型定义组件是必需的,其他可选。
注:数据挖掘模型包括预言模型和描述模型,因此,PMML并不是全面的数据挖掘模型定义语言。

3.官网

http://www.dmg.org/v4-1/GeneralStructure.html
参考资料:http://baike.baidu.com/view/1363485.htm;http://www.ibm.com/developerworks/cn/xml/x-1107xuj/index.html