依存语法:从短语结构树转换为依存树

来源:互联网 发布:北京赛车数据接口 编辑:程序博客网 时间:2024/05/18 00:27

依存语法:从短语结构树转换为依存树

                                                           冯志伟

 

与短语结构语法比较起来,依存语法没有词组这个层次,每一个结点都与句子中的单词相对应,它能直接处理句子中词与词之间的关系,而结点数目大大减少了,便于直接标注词性,具有简明清晰的长处。特别在语料库文本的自动标注中,使用起来比短语结构语法方便。

一般而言,短语结构语法是与依存语法等价的。因此,如果我们在短语结构分析之后得到了短语结构树,可以自动地把这样的短语结构树转换为依存树。

例如,“铁路工人学习英语语法”这个句子,如果用短语结构语法分析之后得到如下的短语结构树:

 

依存语法:从短语结构树转换为依存树

                                              短语结构树

 

我们可以把它转换为依存树:

 

                  依存语法:从短语结构树转换为依存树

  

 

                                                          依存树

 

    显而易见,依存树的结构比短语结构树简洁得多,层次和结点数都减少了。因此,依存语法受到了自然语言处理研究者的欢迎。

    如果在短语结构树中,确定了结点之间的依存关系,把处于支配地位的词叫做主词,处于依存地位的词叫做从词,那么,就可以把短语结构树转化为依存树,转换的步骤是:

     从叶子结点开始,首先把表示具体单词的结点归结到表示词类的结点上;       

     然后,自底向上把主词归结到父结点上;

     最后再把全句的中心主词归结到根结点上。

    通过这样的步骤,便可以得到与短语结构树等价的依存树。

    例如,在上面的短语结构树中,首先把“铁路”归结到支配它的结点N上,把“工人”归结到支配它的结点N上,把“学习”归结到支配它的结点V上,把“英语”归结到支配它的结点N上,把“语法”归结到支配它的结点N上。然后,把NP“铁路工人”中的主词“工人”归结到其父结点NP上,把“学习”归结到其父结点VP上,把NP“英语语法”中的主词“语法”归结到其父结点NP上,最后,再把全句的中心主词“学习”从结点VP归结到根结点S上,就得到了上面那个与短语结构树完全等价的依存树。

       由此可见,依存语法与短语结构语法具有等价性。通过有穷的步骤,我们不难实现短语结构语法和依存语法之间的相互转化。

http://blog.sina.com.cn/s/blog_72d083c70102drof.html

原创粉丝点击