Big Data 2011

来源:互联网 发布:北京工业大学网络教育 编辑:程序博客网 时间:2024/05/19 02:23

昨天去中旅大厦听了Big Data 2011,感触良深。

与会的多是国内IT业精英,来自baidu、淘宝、新浪、Admaster、阿里等大数据存储专家就当前的Big Data趋势就技术层面作了一次深入交流。作为一次开放式的交流,整体的感觉是GIS界内人士太封闭,从思想到技术,似乎还在十年前。新的技术足以达到让GIS翻天覆地的革新,而GIS界却没有意识到。比人在管理大数据,难度我们不是大数据吗?应该开始思考如何借Big Data之势来从技术上推动GIS,而不是一味的追逐云计算,应该首先从数据管理来着手。

兴趣点一,R语言。神州数码对R进行大幅褒奖,的确,以前忽视了,原来做统计分析还有这么好的东西。值得关注的是最新发布的R已经支持并行计算,并且可以和MapReduce进行结合。此外,R有3400+个算法包,Spatial packet也在其中,显然可以作为并行GIS的一部分——统计分析并行化。

兴趣点二,OceanBase。淘宝真的是难能可贵,开源了其最近上线的分布式数据存储技术。刚才svn下来看了下,值得好好学习。OceanBase似乎是走中间路线,在兼容Sql的基础上,寻求NoSql的性能。

兴趣点三,yahoo s4,twitter storm

原创粉丝点击