Twitter,Facebook和社交媒体 - 对非结构化数据分析

来源:互联网 发布:模拟汽车软件 国外 编辑:程序博客网 时间:2024/05/22 06:21
Twitter,Facebook和社交媒体 - 对非结构化数据分析   引用维基百科: - 非结构化数据(或非结构化信息),是指信息,要么没有一个预先定义的数据模型和/或不合身到关系表中。非结构化信息通常是文字为主,但可能包含数据,如日期,数字和事实也是如此。这会导致不规则和模糊,使人们很难用传统的计算机程序相比,存储在派出形式在数据库或注释(语义标签)文档中的数据理解。   是的,大多数大数据源,包括Facebook,Twitter等,都有非结构化数据。几乎没有分析可以在此非结构化数据直接工作。非结构化数据是起点,但它必须是变态到一些结构化的格式之前,我们可以与任何实际的分析技术,应用程序启动。那么,什么是过程?   商务要求: - 鸣叫,Facebook的帖子和其他社会意见要进行分析,以确定人口的情绪。   创建半结构化/结构化数据(可配合到关系表),将涉及解剖文成单词和词组,然后可以从OOD分类?到广告?之间的一切。转换的数值,这将是-1的范围+1。这组数字充分的数据,然后可以使用了。和所有的分析技术可被用来推断并得出结果。因此,从非结构化数据中提取结构化数据的一个新的步骤被添加到分析过程。   因此,所有的分析技能和技巧要保持非常有效的在这一新的模式。只有数据的类型,源和它的一般理解,必须重新vamped。和我们大多数分析师能呼吸了一口气。   因此,没有转换非结构化到结构化数据的过程必须是手动,直通启发?或机械驱动的直通算法?算法降低精度,但会增加规模。因此,一个明智的决定,或逐渐从手工到算法,可用于在组织内部规范这一过程。   事实上,在这整个风景,删除哪些数据决策变得至关重要。并有一组新的数据监护人谁在帮助企业只保留相关数据的专家。   这种理解,所有的点点滴滴走到一起给了很大的信心,以决策过程的动态和大数据。   拼图学院提供为企业和一些在国内领先的MBA学院的分析培训班。拼图教材经过精心研制,使学生理解和运用分析技术来解决业务问题。
0 0