CSDN week4及期中总结
来源:互联网 发布:java报表工具 开源 编辑:程序博客网 时间:2024/06/07 03:21
总目标
- 实现数据流的自我结束
- 实现批量处理
- 支持Hadoop MR1.0的Map和Reduce接口
当前实现目标
- 基本实现数据流在单机模式上的自我结束,尚且存在一些迁移到0.9.4版本上的问题
- 已经有了基于0.9.3的大致框架,尚待迁移到0.9.4并完善
- 预计在后期实现支持Hadoop MR1.0的Map和Reduce接口
前期回顾
- 第一周:因还有短学期仅仅配置了下环境,期间jdk的版本问题折腾了蛮久
- 第二周:运行例程,配合输出日志文件理解源代码,同时参看storm有关的源码解读(不得不说Clojure看起来很累人)
- 第三周:暑期社会实践占去不少时间,所以还在看源代码以及写一些零碎的测试代码
- 第四周前期:着手实现自我结束功能,大致拟定批处理实现框架
- 第四周后期:在向0.9.4版本迁移的同时继续实现自我结束功能
遇到的坑
- JDK新版本不支持MaxTenuringThreshold超过15,且一共需要修改3个地方的配置文件,经常没改全就编译了
- 承接上条,测试例程时worker建立不起来,因为此时还没有生成worker的log文件,同时其在supervisor中的错误提示过于笼统无法在网上找到准确解决方案。最后捣鼓了半天才得知是上面那条问题,配置没全部改过来。
- 编译例程源代码时需要增加额外的依赖
- 端口未配置妥当,导致worker不断向磁盘写日志文件,导致系统卡住
- yaml文件的格式要求不是一般得严格
中期感想
- 初期很难进入状态,因为一无所知,这时就需要足够平和的心态
- 阅读源码是一个需要足够清晰思路的过程
- 遇到的错误问题有时候找了一圈才发现是自己手贱没有写好配置信息,所以慢慢思考有时能快速找到解决方案
- 开源是一件很有趣的事,在storm-user的group里能经常看到storm作者nathanmarz帮助解决问题的帖子以及整个社区的人之间的互助
后期计划
- 尽可能在八月上旬完整完成前两项要求,然后开始着手第三项要求
- 有了第一个月的基础以及更多空余的时间,相信能比较快地实现前两项要求
- 因为有一定的hadoop经验,开发接口应该能比第一个月顺利
附加文件
- 测试日志
0 0
- CSDN week4及期中总结
- 期中理论题总结
- CSDN开源夏令营 百度数据可视化实践 ECharts(6) 期中总结
- 大一上学期期中总结
- 大一下学期期中总结
- 三道期中考试题总结
- [week4]每周总结与工作计划
- week4
- [开源夏令营][八] 期中总结
- Linux u盘助手期中总结
- 斯坦福Machine Learning Week4总结(包括作业)
- 2016.4总结(月考省选期中三连挂)
- javaee期中考前简略只是总结(个人/很简陋)
- 投票:微机原理及接口技术课程期中调查
- 期中测验题目及参考答案 类-对象-运算符重载
- 期中考
- 期中作业
- 期中反思
- 如何将pdf文件转换成excel文件
- 编程学习路径
- 浅谈大学,爱好,与父母交流
- MTK6592 GPIO模拟I2C
- oKit产品视频全新上线
- CSDN week4及期中总结
- 关于回音消除技术
- listview点击item,在item的上边弹出popwindow
- Emmet(Zen Coding) 可以快速编写html/css
- Android应用源码ListView实现的目录树结构
- Ogre动画
- ext panel 自定义图片刷新
- cocos2d-x 2.2 android环境搭建(不用cygwin)
- 【日记】面对浩瀚的世界