IBM Parallel Machine Learning Toolbox 简介

来源:互联网 发布:linux系统可以ghost 编辑:程序博客网 时间:2024/04/30 03:13

 IBM Parallel Machine Learning(PML)Toolbox 可以从 IBM® alphaWorks 下载获得,它使您能够在并行平台上运行机器学习算法。它可以在合理的计算时间内在大型数据集上对这种算法进行训练。这个工具包包括了几个算法,以及用来添加自己的算法的 API。PML Toolbox 是 IBM Haifa Research Lab 的 Machine Learning 小组与 IBM T.J. Watson Research Lab 的 Data Analytics 部门之间的合作成果。PML Toolbox 开发小组的成员在本文中将解释它们开发这个工具包的动机,介绍其中包含的算法,并展示如何添加自己的算法。
开发 IBM Parallel Machine Learning Toolbox 的缘由

>
如今,大型的数据集在应用程序中非常常见,例如 Web、生物信息学、语音和图像处理。大部分机器学习算法都无法在单个节点上处理如此大量的数据。另外,由于单个节点处理能力逐渐趋于恒定,开始出现大量的多节点机器。

PML Toolbox 使我们可以通过将学习过程分布到节点之间来利用多核机器、计算节点集群甚至超级计算机的计算能力。它使用了流行的 MPI 库作为操作的基础,并且是使用 C++ 编写的。PML Toolbox 包含了很多常用的机器学习算法,还包含了一个集成其他算法的 API。它可以从 IBM alphaWorks(请参看 参考资料)下载,可免费用于研究目的。

。。。。。。

                          点击此处查看详情 

原创粉丝点击