Spark错误异常-stdout日志乱码
来源:互联网 发布:.net域名续费价格 编辑:程序博客网 时间:2024/06/06 10:55
采用Apache版本Spark1.2.1时没有出现乱码,但Spark-1.1.0-cdh5.2.1版本中,在分布处理的map函数里对中文数据进行debug打印输出进行时出现问号乱码
val rs = rdd.filter(e => {val (lable,text) = (e._2(2), e._2(3)); m.filterItem(lable, text) }) .reduceByKey((x,y) => m.merge(x, y)) .map{case (x,y) => {println(x + "\t" + y); (x._1.toLong, x._2, y(1), y(3) )}}// 打印输出内容china.cn/, A0, ,???:???,,??:?????????????138?,??:7975209__??:15028078833__??:15176090928,,,,,,,,????:???????????????????????(11)???,,,,, false, 4, 7)????????????? 17 ,???:???,,??:?????????????138?,??:7975209__??:15028078833__??:15176090928,,,,,,,,????:???????????????????????(11)???,,,,在/var/run/spark/work/目录中查看应用目录app-20150605171809-0003中的stdout文件文件格式
stderr: ASCII C++ program textstdout: UTF-8 Unicode text, with very long linesstdout是ASCII编码的,对中文肯定显示不了
在使用service启动Java程序时,机器上hadoop中stdout输出的日志也是是中文乱码,怀疑是service启动时载入的环境变量不匹配
修改 /sbin/service ,在env -i 后面加上 LANG="$LANG",重启spark的各节点
service spark-master restartservice spark-worker restart最后重新运行程序,日志文件stdout文件中文显示正常.
0 0
- Spark错误异常-stdout日志乱码
- swagger乱码(异常)错误
- php日志错误异常处理
- Spark错误异常-资源占用,任务挂起
- linux 后台日志 mysql 错误异常解释
- C#错误异常日志记录到文件
- PHP 错误与异常的日志记录
- 关闭tomcat6下的stdout日志
- stdout
- Spark 日志
- spark读写hdfs后出现的异常错误
- Spark错误异常-sparkMaster GC overhead limit exceeded
- 标准输出stdout、标准错误stderr
- [c++]记录Windows程序“应用程序错误”到异常日志
- [c++]记录Windows程序“应用程序错误”到异常日志
- [c++]记录Windows程序“应用程序错误”到异常日志
- [c++]记录Windows程序“应用程序错误”到异常日志
- magento 错误、异常日志的开启和查看
- 【Intellij Idea】 部署Maven项目到Tomcat的方式
- RabbitMQ四种Exchange类型之Headers(Java)
- xss攻击与防御
- //网络Okhttp
- LeetCode 83. Remove Duplicates from Sorted List
- Spark错误异常-stdout日志乱码
- 第十六周项目2-大数据集上排序算法性能的体验
- python - urllib2简介
- 动态顺序表的实现
- http://blog.csdn.net/jeffasd/article/details/51183686
- 那些Python方法---zip()
- Linux初学者必学指令
- 游戏与算法的必经之路!
- LeetCode 82. Remove Duplicates from Sorted List II