语义网傻瓜FAQ

来源:互联网 发布:linux 如何创建.c 编辑:程序博客网 时间:2024/04/29 05:10

http://boole.cs.iastate.edu/semanticweb/topic.cgi?forum=10&topic=49&show=0

目标读者: 技术人员, 但是没有接触过语义网的
Jie Bao

Q: 语义网要干什么?
A: 现在的互联网是给人读的, 语义网不但要给人,还要让电脑读懂。电脑明白了网页的意思就可以更精确的搜索。

Q: 语义网是怎么定义的?有什么特别的好处?
A: 说白了, 和给书后面加索引差不多. 要给网页加上其内容的索引.

Q: 好像明白一点点。现在这方面的研究进展如何?
A: 第一步, 明确了索引的表现形式, 比方说是单独编页码啊还是延着正文编, 是用阿拉伯数字啊还是罗马数字或者中文. 这就是编码层 URI和unicode
第二步, 明确了索引的语法形式, 比方说是用图啊, 还是表格啊, 还是清单啊. 这就是句法层XML
第三步, 明确了索引中项目的相互关系, 比方说主题A是主题B的一个子问题啊, 主题B是主题C的相关问题啊. 这就是资源描述层RDF
第四步, 明确了索引中项目的精确意思. 比方说你说菜谱1后面的索引里的"炒三鲜"和菜谱2后面的索引里的"炒三鲜"是不是一样的? "炒三鲜"菜谱里提到一个概念叫"酱油", 到底是老抽还是生抽? 这就是本体层ontology, 现在制定了一种语言叫OWL来描述,

现在大体上完成了前4步, 根据规划, 下面要做一些推理和逻辑的工作, 比如说, 有人要找一个菜谱要求不是辣的, 某一个菜谱里所用到了老干妈辣酱, 而老干妈辣酱是辣的, 所以这个菜不符合要求. 再下一步, 要保证信息是可信赖的, 比方说, 你找到一个菜谱说做麻辣豆腐要放砒霜, 这就肯定不对劲. 语义网最后要能判断这个信息是不是对的.

Q: 这个东东是什么地方先提出来的?
A: 环球网论坛(W3C), 也是Web和HTML的制定者.

Q: 什么叫本体论(ontology)?
A: 本体论就是概念和概念之间的联系. 最常见的本体论就是字典. 还有图书馆的分类目录, 公司的组织结构图, 都可以看做本体.

Q: 什么叫RDF
A: 是Resource Desrciption Framework的缩写. 每个RDF句子实际上是一个主语+谓语+宾语的句子如:
[张三][喜欢][豆腐脑]
[豆腐脑][是一种][食物]
[豆腐脑][含有][水]
这样可以比较明确的定义网上的各种资源的关系, 比如
[Jie Bao][isAuthorOf][http://semanticwww.com]

Q: 什么是OIL, DAML, DAML+OWL, OWL?
A: 他们都是本体论语言, 都是建立在RDF基础上的. 可以表示为
RDF -> OIL , DAML -> DAML+OIL -> OWL
OIL是欧洲开发的, DAML是美国开发的, 是两种类似的对RDF的扩展, 所以后来合并为DAML+OIL, 随后被W3C标准化为OWL

2004/04/20
Q: 建好了ontology我们怎么去用它呢?
A: 对语义网, 主要用于让软件agent描述资源和查询. 打个比方, 词典和百科全书就是你的ontology, 你阅读杂志的时候可能要查工具书, 并且往往会利用词条之间的关系来理解杂志上的内容. 这和agent阅读用本体标注过的页面是一样的.