Open Source BI Projects

来源:互联网 发布:手机调光软件 编辑:程序博客网 时间:2024/05/16 04:45

Open Source BI Projects

        介绍当前比较流行的开源商业智能项目和工具。

1. OLAP4J

        OLAP4J一个类似于JDBC驱动,能够用于访问任何OLAP服务器的Java公共类包。所以你可以开发一个应用程序来实现一个OLAP服务器与另一个服务器的交互。

2. Mondrian

        Mondrian是一个采用java开发的OLAP服务器,能够分析存储在SQL数据库中的海量数据而不需要编写任何SQL脚本。Mondrian用于数据的多维探测。它支持把MDX(Multi-Dimensional eXpression)语言转换成SQL。

        Mondrian是一个开源项目。一个用Java写成的OLAP(在线分析性处理)引擎。它用MDX语言实现查询,从关系数据库(RDBMS)中读取数据。然后经过Java API用多维的方式对结果进行展示。多维数据中,维度(dimension),层次(Hierarchies),级别(Level)等概念很重要。

        OLAP用了多维分析的技术。尽管关系型数据库所存储的所有数据都是以行和列的形式存在的,但一个多维数据集还是可以由轴(axes)和单元(cell)组成。

        联机分析处理(On Line Analytical Processing,简称OLAP) 概念最早由关系数据库之父E.F.Codd于1993年提出。OLAP应用是目前数据仓库上的重要应用之一,是决策分析的关键。作为数据仓库最重要的多维分析工具,OLAP利用存储在数据仓库中的数据完成各种分析操作,并以直观易懂的形式将分析结果返回给决策人员。它的目标是满足决策支持或多维环境特定的查询和报表需求,技术核心是多维分析。OLAP具有灵活的分析功能、直观的数据操作和分析结果可视化表示等突出优点,从而使用户对大量复杂数据的分析变得轻松而高效,以利于迅速做出正确的判断,辅助决策。

3. JPivot

        JPivot是一个JSP标签库用于操作OLAPTable,让用户可以执行基本的OLAP操作,如切片、切块、上钻、下钻等。JPivot使用Mondrian作为它的OLAP服务器但也支持XMLA数据源访问。

JPivot

4. Kettle

        Kettle是首屈一指的,开源的ETL工具。数据集成平台是建立与便携式,基于Java的体系结构和开放的,基于XML的配置和工作语言。 Kettle功能可以成功地与主要商业产品竞争今日。

Kettle

5. Weka

        Weka是一组用于数据挖掘的机器学习(machine learning)算法。这些算法可以直接应用于数据集,也可以从Java代码中调用。Weka包含的工具可以用于数据预处理,分类,聚类,关联规则,可视化。它还非常适用于开发新的机器学习方法。

        WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。

        WEKA作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

6. olap4cloud

       olap4cloud是一个基于Hadoop/HBase/MapReduce的OLAP引擎。它构建服务于包含分组和聚合的OLAP查询。以下是olap4cloud提供的典型查询服务。

select d3, sum(m1), min(m2) from facts whered1 in (1,2) and d2 in (2,3) group by d3;

原创粉丝点击