关联课程数据

来源:互联网 发布:淘宝卖家退款给买家 编辑:程序博客网 时间:2024/06/06 20:05

随着信息化的社会高速发展,万维网极大地改变了我们传统的计算和共享信息的方式,当今的网络主要通过超链接方式相互关联,这种方式有利于人们更好地理解、利用资源,但机器是无法直接理解的。现在的万维网都称作语义网,W3C定义语义网是一个为共享数据、信息等资源提供框架的平台,其主要目的就是创造一个数据相互关联的网络。而关联数据是共享网络上结构化数据的最好方法,为了实现数据网络,语义网需要标准格式的可用数据,但是大量的数据都是html形式储存在Web上,其中包含有很多高质量的关系型数据。

     在很多领域,如医疗健康,生物科技和金融等都是以表格、表单,CSV和数据集的形式存储数据,因此可以将表格看作这些信息和知识的数据集,并且充分利用起来丰富我们的知识库。虽然人工可以将这些原始数据转换为结构化形式的数据,但那十分耗时而且相当困难。

     由于很多在电子表格或数据库中的开放数据是由结构化的表格编码及发布的,而现今由这些数据生成语义网模型的方法需要人工介入来创建关系,并经常无法与关联数据很好匹配。至今许多支持对文本内容浏览和搜索的模型根本无法适应现今信息化社会的要求,因此需要一种新的机器自动处理模型来替代现有的查询系统,使信息查询、 处理结果更加可靠准确。为了更好地解决这些问题,我们需要开发一种自动将表格文档转换为结构化形式数据的机制。我们首先给表格中每个列头从合适的本体中找到一个类标签,接着将每个单元值链接到关联数据云中的合适的实体,然后通过给表格添加注释并且从中挖掘出潜在的关系给表格添加语义,进而开发一个能够自动关联、集合、查询表格的单独元数据分析系统。这将会大大有利于通过现有的原始数据集来产生高质量的关联数据,从而更加有助于企业、图书馆和政府等机构知识库的资源发现和提高信息查询的效率。


0 0
原创粉丝点击