利用jena读取owl文件的父子属性以及其他属性

来源：互联网发布：linux 清空屏幕编辑：程序博客网时间：2024/05/23 00:00

最近，学习的过程中需要处理owl文件，我的需求比较简单，不需要用到推理，但是要读取到owl文件中的所有的属性以及属性值。经过在网上大量的搜索和阅读后，发现大部分都是讲如何创建RDF文件后者是owl文件的，或者是获取指定属性名的属性值，并不能够获取owl文件中所有的属性以及属性值。后来通过查看jena的API找到了方法，记录下来一块分享一下。

为了更好的使用Jena API，我们应该对OWL有个大致的了解。OWL核心是围绕三元组的，即我们在很多资料中看到的陈述（Statement），它的组成为：Statement=(Subject,Property,Object)，其中Subject我们熟成为主体，Property成为属性，Object成为客体。在编程中容易让人搞混的他们和Individual的区别。Individual熟称为个体。它是Subject、Object的一个实例，例如在Statement=（Animals,Eat,Plants）陈述中sheep是Animals的一个Individual，grass是Plants的一个Individual。从这个角度上来说我们理解为什么主体、客体被说成是类（Class）。而这一切的主体、客体、个体、类、属性等我们都可以称为资源（Resource）。在编程中OWL常用的是OntModel,Ontclass,OntProperty,Individual。OntClass可以用来创建主体，客体，OntPropety用来创建属性，Individual用来创建个体。常用的方法有CreatClass,CreatIndividual,listObjects,listObjectsofProperty,listSubjectswithProperty,listPropertyvalues等。

本体文件部分图示：

我的需求很明确，就是将一个owl文件中的所有的属性名称(包括父节点、子节点)以及相对应的属性值读取出来。接下来直接上代码：

//创建一个本体语言指定语言类型.OntModel ontModel = ModelFactory.createOntologyModel(OntModelSpec.OWL_MEM);try {ontModel.read(new FileInputStream("c:/util/owl/symp.owl"), "");    } catch (FileNotFoundException e1) {e1.printStackTrace();    }// 迭代显示模型中的类，在迭代过程中完成各种操作for (Iterator<?> i = ontModel.listClasses(); i.hasNext();) {<span style="white-space:pre"></span>parentList.clear();OntClass c = (OntClass) i.next(); // 返回类型强制转换if (!c.isAnon()) {//如果不是匿名类，则打印类的名字// 迭代显示当前类的直接父类for (Iterator<?> it = c.listSuperClasses(); it.hasNext();){OntClass sp = (OntClass) it.next();        //得到的id号为obo:SYMP_0000743 因此要去掉obo:因此从3开始截取                                parentList.add(sp.getModel().getGraph().getPrefixMapping().shortForm(sp.getURI()).substring(4));                                 } // 迭代显示当前类的直接子类for (Iterator<?> it = c.listSubClasses(); it.hasNext();) {OntClass sb = (OntClass) it.next();                                childIdBuf.append(sb.getModel().getGraph().getPrefixMapping().shortForm(sb.getURI()).substring(4)+"~");}StmtIterator iterator = c.listProperties();while(iterator.hasNext()){<span style="white-space:pre"></span>Statement statement = iterator.next();                   <span style="white-space:pre"></span>predict = statement.getPredicate().toString().substring(statement.getPredicate().toString().indexOf("#")+1);        //得到的数据类似encephalitis^^http://www.w3.org/2001/XMLSchema#string 因此要截取^^之前的部分                                        //如果不是字符串类型的数据则没有^^这个符号因此符合这个规范的才进行操作        object = statement.getObject().toString();}

｝

｝

这样就完成了整个的遍历过程。再找到此方法之前，自己尝试过直接使用jena自带的PersistentOntology这个类中的方法直接存入数据库，但是发现他会自动生成好多张表。而且里面有一些数据是不可解释的(可能是我没理解吧)，而且属性名前面会加上前缀，不利于进一步进行操作。

希望对和我有同样困惑的朋友有所帮助！

0 0