Python第一次运行分布式计算程序

来源:互联网 发布:arch 阿里云 编辑:程序博客网 时间:2024/06/03 15:37

1.     Python第一次运行分布式计算程序.

(1)    在Linux终端执行以下命令:

cat inputFile.txt | python mrMeanMapper.py

(2)    在windows系统下,可以在DOS窗口输入以下命令:

Python mrMeanMapper.py < inputFile.txt

执行结果如下,但是遇到一些问题:(目前还没找到解决办法)

要将目录切换到python的安装目录,否则报错:'python'不是内部或外部命令,也不是可运行的程序或批处理文件。

要执行和读取的文件(.py和.txt文档)也必须放到这个安装目录下面


(1)    同时运行map和reduce:

Linux: cat inputFile.txt | python mrMeanMapper.py | pythonmrMeanReducer.py

windows:python mrMeanMapper.py < inputFile.txt | python mrMeanReducer.py

运行时,mapperOut是如下二维列表:


很明显第二个列表的元素无法转换为float, 故原代码运行会出错


自己修改代码为:要使用strip()去掉字符串首尾空格,否则也可能报错



贴出书上源代码如下: