《大数据时代》第一章

来源:互联网 发布:香港阿里云 编辑:程序博客网 时间:2024/05/02 12:48

统计采样:

1.采样分析的精确性随着采样随机性的增大而大幅提高,但与样本数量的增加关系不大。样本选择的随机性比样本数量更重要。

2.如果抽样的对象变得复杂,例如是一个网络,那根本就找不到“最优抽样的标准”,更不可能要求得到的小网络能够反映总体的所有结构特性。

3.随即抽样不适合考察子类别的情况,一旦继续细分,随机采样结果的错误率会大大增加。

4.通过随机采样得出的调查结果不具有延展性,只能实现计划内目的。

5.采样的目的就是用最少的数据得到最多的信息。但当人们可以获得并处理海量数据时,它就没什么意义了。


大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。这里的“大”是相对意义而不是绝对意义,也就是说这是相对于所有数据来说的。


本文只是对书中一些内容做了摘抄以备后用。

0 0
原创粉丝点击