大数据之大

来源:互联网 发布:规则引擎 java 编辑:程序博客网 时间:2024/04/25 16:35

[Mr.Snail注]  《独步spark》系列文章纯属Mr.Snail瞎扯、闲聊,目的在于: 记录Snail在学习spark过程中的所思所想 ; 记录生活中所发生的有趣的事情。


参考


http://spark.apache.org


问题


对大数据到底有多大的思考


随笔

一、屌丝逆袭的时代

由于种种原因,Mr.Snail决定先暂时放下多年来埋于胸间的考研“大事”,把精力转到工作上来。

接触J2EE(就是java WEB程序员谋生所需的相关技术集合)近4年,个人感觉搞J2EE实在没有太大的吸引力,体现不出一个程序员的价值,J2EE程序员与屌丝严重挂钩。怎么说呢?

个人认为程序与音乐是相通的,如果把java比作一门乐器,我想吉他是再合适不过了:

1、会弹吉他的同学很多,大多数会弹吉他的同学是屌丝 :不懂甚至完全不懂乐理,也可以在短至一个月内有模有样地弹唱一首比如《滴答》之类的口水歌。

2、会 java 的同学很多,大多数会 java 的同学都是屌丝:  没有甚至完全没有任何计算机功底(不了解《数据结构》、《操作系统》、《组成原理》等计算机基础课程并且认为这些东西不重要)的同学也可以花几个月时间去某培训机构参加一下java培训,完了找到一份 java 相关的工作。

其实,Mr.Snail内心深爱着java与吉他。一首简单如《月亮代表我的心》的口水歌,只要以吉他为主要伴奏乐器,一下子就好听了很多;一个夜深人静寂寞难耐的夜晚(就像现在),小心脏噗通噗通地无处安放。此时对着Eclipse狂鲁几行代码,完了将其以博客的形式发表,也不失为一种向上的生活方式- 当然,性趣盎然时以大片自鲁,别人也是无法阻挡你的。

重点是,狂屌丝又如何?!这正是一个屌丝逆袭的大好时代,大数据时代!

二、大数据到底有多大
大数据到底是什么啊,反正这几年炒的特别火,反正比较fashion,反正比较cool,反正比较高大上,反正Snail 说要升级做大数据开发,听说钱途光明,值得余生为之奋斗!

问题来了,大数据到底有多大呢?先来说说衡量数据大小的单位。大致有KB、MB、TB、PB等,关系如下:

1 PB = 1000 TB = 1000*1000 GB = 1000*1000*1000 MB = 1000*1000*1000*1000 KB

也就是说 1PB = 10亿MB!据说 facebook 在2012年8月份每天增加的数据就大致有 0.5 PB。汪峰的单曲《美丽世界的孤儿》,在酷我音乐中下载高品质版本有 5.17M大,酷我播放完毕历时 5分38秒。 为了方便计算,这里假设这首歌有4M,从头放到尾需要4分钟。假设一首歌曲有1 PB 大,那么用酷我播发完毕需历时 10亿分钟-约等于 1902年!啊,“因为在一千年后,世界早已没有我,无法深情吻着你的  。。。” 。Mr.Snail猜想,PB级别的数据量,应该就可以称之为大数据了吧!

好,今天就写到这里,洗洗睡。


瞎说

  1. java相当与吉他,屌丝为逆袭而生!
  2. 用酷我播放器不间断地播发一首完整的大数据版《美丽世界的孤儿》需要历时1902年!




1 1