闲聊大数据之---大数据之前

来源：互联网发布：手机pdf制作软件编辑：程序博客网时间：2024/04/28 21:18

任何事物的出现都不是突然的，其出现必定是有其相关的历史原因和时代背景。就像现在大数据出现一样，不管你将大数据作为一种现象来理解还是作为技术革命来理解，都有隐藏在其背后浪潮。那么大数据背后的浪潮究竟是什么呢？

信息的存储和处理从人类诞生以来就开始萌芽，几乎和人类的衣食住行一样，作为最较底层的需求同时存在。最简单的例子就是他们要记录每天打猎数量的多少，或者食物如何分配等。信息记录的方式也随着人类社会的发展在不断变化，有刻在石头上的、刻在骨头上的、刻在竹简上的、还有丝绸上的，后来到纸张，最后到现在的计算机存储。这种信息载体的一路演变，从某种程度上来说也从侧面反应了人类社会的发展程度。信息的载体每转换一次，都可以看作为信息世界的一次革命。因为每一次的变革都会导致信息存储的容量、信息的可携带型、可复制性、可留存性等发生或多或少的改变。下图分析了各种信息载体在各个方面的特点：

信息容量

可携带性

可复制性

可留存性

骨头

较差

一般

竹简

差

丝绸

一般

差

一般

纸张

好

很好

差

计算机

较好

从上图可以看出，每一次的信息载体的改变，追求的必定是信息容量和可携带型的提高（其它方面不一定）。也就是说，随着社会的发展，人们需要存储越来越多的数据，并且信息的可携带性要好。并且这其中，信息容量和可携带型其实是有关联的，对于某种信息存储的载体来说，信息存储的密度越大，存储同样量级的数据需要的载体就少，可携带型就提高了。因此，纵观这个发展流程，计算机这样高存储密度，高可携带性存储介质（暂且称为介质）的出现，满足了人们对海量数据存储的愿望，无疑成了大数据出现之明亮的曙光。

从信息处理的角度来看，在计算机出现之前，基本都是靠人类本身对信息的认知和对大自然界的规律的理解来进行的。例如，在语言处理这一块，基本靠人类在社群中学会的语言处理能力来进行，没有特定的工具去帮助人类把这块能力独立出来，对人类语言处理进行适度的解放。在数字处理这一块，会有一些进展：例如：人类采用打结的方式进行计数，后来人类总结了计算经验出现了《九章算术》，还有各种辅助计算的算盘、计算器等。但是所有的这些工具或者规律，都不能完全摆脱人作为独立的能力存在。但在计算机出现后，一切都变化了。人类可以将自己所学的经验或者能力，以计算机能处理或者“读懂”的模式教给计算机，从而将自己独立出来，让计算机去帮助人类去自动的进行处理，这一块在人工智能和数据挖掘领域体现的特别突出。

毋庸置疑，计算机的出现在信息存储和信息处理上都算的上是信息领域的一次重大革命。但是，计算机出现了就必定注定了大数据的出现吗？答案是否定的。独立的计算机不管是信息的存储能力还是处理能力都是有限的，必须将眼光转向群体协作才可能迎来新的转机。因此，计算机之间的信息交互和分工协作（资源调配）是接下来为大数据的出现准备的两股强大力量，正是这两股强大的力量，为大数据的出现打好了坚实的技术基础。其中包括网络设施的发展、通信协议的完善、web技术的发展、摩尔定律、虚拟技术等。

所有的条件都成熟之后，最后一个引爆大数据的导火索就是：大规模的信息化与互联。将现代社会各种形式的信息集中起来，并且将各种终端进行互联，彻底的将大数据摆在了人们面前。下一篇我们将深入探讨什么是大数据。

0 0