nlp-形式语言与自动机-ch10-统计机器翻译

来源:互联网 发布:淘宝新店怎么参加活动 编辑:程序博客网 时间:2024/05/21 08:40

1、基于规则的转换翻译方法:

对源语言和目标语言都进行适当描述、把翻译机制与语法分开、用规则描述语法的实现思想。

2、翻译过程分为三段:

1)对输入文本进行分析,形成源语言抽象的内部表达;

2)将源语言内部表达转换成抽象的目标语言内部表达;

3)根据目标语言内部表达生成目标语言文本。

3、优缺点:

优点:

可以较好地保持原文结构,产生的译文结构和源文结构关系密切,尤其对于语言现象已知或句法结构规范的源语言句子具有较强的处理能力和较好地翻译效果。

缺点:分析规则由人工编写,工作量大,规则的主观性强,规则的一致性难以保障,不利于系统扩充,尤其对非规范的语言现象缺乏相应的处理能力。

4、基于中间语言的翻译方法:


5、基于噪声信道模型的统计机器翻译方法:

一个翻译系统被看作是一个噪声信道,对于一个观察到的信道输出字串(句子)S,寻找一个最大可能的信道输入句子T,即求解T使概率P(T|S)最大,根据贝叶斯公式:


6、对齐使统计翻译中的重要概念。

7、对位模型:


阅读全文
0 0
原创粉丝点击