机器翻译随想

来源:互联网 发布:网络教育那个学校好 编辑:程序博客网 时间:2024/05/22 09:40

统计方法有个瓶颈:在多个可能映射中选出概率最大的,就意味着其正确率至多等于这个最大的概率,这个最大概率很可能连百分之五十都没有。既然这是个不可能取得成功的方法,为什么还要继续呢?统计方法顶多只能作为辅助方法对吗?

机器翻译把自然语言映射到形式语言再映射到自然语言,期间最麻烦的最容易造成信息流失的我认为是自然语言到形式语言的映射这一步。自然语言和形式语言本质上都是一种知识表示工具,是不是可以说自然语言表示能力大于形式语言,形式语言追求严谨性而损失了部分表达能力。

自然语言的多样性(多国语言)说明自然语言并非上帝的专利产品,是可以再造的,并且只要遵循一定的规律就可以再造出表达能力一样强大的语言来,那么这些规律是什么呢?人类是如何造出这么多种表达能力如此强大的语言来的呢?我们能不能造出一种不同于现有的自然语言和形式语言的语言来呢?知识表示是智能的核心,至今为止产生了很多形式化的知识表示方法,但显然做得还不够好。找到人类制造自然语言的方法,或者说找到所有自然语言的共同的地方--是这些共同的地方让这么多不同国家的自然语言都具备强大的表示能力,我们就可以制造出更多更好的语言来。一种凌驾于自然语言和形式语言之上的超级语言。语言学似乎是研究这个问题的主力军,然而语言学家们却未能建造一种超强的语言,甚至未能对原有语言做一点点优化,自然语言似乎是慢慢进化着,约定俗成地产生一些内容,逐步丰富着语言库。而语言学所作的只不过是亦步亦趋地去解释已有的或新生的语言现象,甚至无法解释了就简单的接纳。虽然这也是人类认识世界的一种方式,但是就如马克思所说,哲学家们总是忙于解释世界,然而问题在于改造世界。语言学家们是否也该行动一下,改造一下语言呢?就像计算机科学家们不断锤炼计算机语言一样。
编译技术的发展使得计算机从只能理解机器语言到能理解汇编语言再到高级语言,计算机和人类之间的沟通经过编译技术的桥梁之后越来越方便自然。而人与人之间的沟通几千年来似乎没有太大发展,除了网络、无线电之类的技术使得人类的沟通在地域(空间)范围内扩大了之外,人与人的沟通效率和质量并没有提高。是否可以说现有语言系统早已达到极限难有大的改观,要进一步加强人类沟通质量需要引入新的沟通方式,如读脑电波等。

编译器只不过把高度形式化的语言翻译成机器语言,而机器翻译要把自然语言翻译成机器语言,可见比编译难N倍。如果能成功连文盲都可以用话筒写软件了。
程序语言上下文无关,而自然语言上下文有关,极难映射成机器语言。况且已证明,二义性问题是不可判定的。而二义性正是自然语言的固有特性,现在还没有办法消除,更可能的是这是不该消除的,是自然语言具备如此强大表示能力的必须条件。二义才是真理,决定论才是谬论。令人想起海森堡的测不准原理和哥德尔的不完备定理,没有银弹,所有模型都有内部不可消除的缺陷,幸好缺陷也是一种美。
原创粉丝点击