结构化数据、半结构化数据、非结构化数据

来源:互联网 发布:单片机模块化编程教程 编辑:程序博客网 时间:2024/06/05 22:55

结构化数据,数据结构可以固定的数据。结构化数据特征之一就是,可以现有数据结构,再有数据。比如RDBMS的二维表中的数据就是结构化的数据,二维表的结构是固定的,在数据到来之前,字段类型和长度,字段个数以及顺序都是固定的,数据结构定义在数据制造出来之前。

非结构化数据,数据结构难以固定化的数据。比如图片、办公文档、视频数据等。

半结构化数据,可以结构化但无法结构固定的数据。以丰富变化的json格式数据为例,单个字段的类型可以是数字型也可以是字符型等,可以嵌套多层json的伸缩性,这些都造成数据结构无法固定化。所以拥有如上特性的json数据不是结构化数据,但是它也是有结构的。可以将它划归半结构化数据。

结构化数据与非结构化数据,同一种数据,在不同的业务角度下,这边可能作为结构化数据,那边可能作为非结构化数据。比如财务文档,如果需求仅仅是获取财务文档,那么文档本身可以作为最基本的信息项(如同RDBMS中表中的单个字段),这是多个文档组成的数据集合就是基于单个文档的结构化数据。换个角度,如果需求是统计文档中的收支情况,那么单个文档就对应多个基本信息项,这是文档集合就变成了非结构化数据。

原创粉丝点击