hadoop 一些属性值含义

来源:互联网 发布:淘宝网恒源祥毛衣 编辑:程序博客网 时间:2024/05/19 20:42

1.mapreduce.input.linerecordreader.line.maxlength .
当使用TextInputFormat作为inputformat时,会遇文件中一些行过长,这样,我们可以通过这个mapreduce.input.linerecordreader.line.maxlength 来跳过这些异常行。

  1. mapreduce.input.keyvaluelinere.cordreader.key.value.separator
    针对一个文件中既有键又有值为情况,键和值之间的分隔符可以通过这个属性值来确定。默认是tab键

3.mapreduce.input.line.inputformat.linespermap
使用TextInputFormat,KeyValueTextInputFormat,mapper处理的行数是不固定的。如果需要每个mapper处理的行数是固定的,可以使用NLineInputFormat。,那么通过mapreduce.input.line.inputformat.linespermap这个属性就可以确定每个mapper处理多少行。