吃货的自然语言消岐

来源:互联网 发布:c 软件架构设计 编辑:程序博客网 时间:2024/04/29 03:31

吃货的自然语言消岐

20131129

20:22

贝叶斯分类

 

贝叶斯分类是在消除歧义时使用一个长度有限的窗口,根据上下文的性质求出最大的可能性的语义是哪一个。

 

但是这种方法在某些较为复杂的语句分析中可能存在问题。

 

比如说:

有一个烧烤店的广告:“烤各种烤串,涮串”

这句话是什么意思呢??这句话本身是一个错误的句子。

句首的动词烤按时了后面的宾语是烧烤用的原材料(根据这是一家烧烤店的广告这个信息。这个信息相关的知识是:一家店铺的广告中可能包含店铺的经营范围,而烧烤店是出售烧烤食品的店铺。)。但是涮串怎么可能是烤这种烹饪方式的原材料呢??涮串只可能是涮这种烹调方式的原材料。

 

对于一个有智能的人来说,我们可以快速的得出结论:这家店不止是烧烤店,还兼卖涮串。这是最可能的情况。还有一种可能是这家店做出了创新:可以把涮串通过烤的方式烹饪。

这时,根据我们对涮串这种食材本身和烤这种烹饪方式的了解,我们大致推断出这种做法并不合适,因而这家店应该不会采取这种做法。

 

但是,如果这家店的广告是:“烤各种烤串,羊肉”

 

我们通常说烤羊肉串,涮羊肉。

羊肉和涮串一样属于名词,涮品。

在词典中,这个句子的表现形式应该和上面的句子相同。

但是,我们知道有烤羊排这种烹饪方法,所以烤羊肉很可能是一种新的烹饪方式。

 

而一个烤串店兼卖涮串的可能性较大,而兼卖涮羊肉的可能较小。同时,涮羊肉也是一种特别的涮品,无法单独销售(火锅店一般不可能只销售一个品种的食物)。

 

所以我们把广告:“烤各种烤串,羊肉”看做是店家的一种创新,是一种新的搭配。

 

我尝试把涮串改成任何一种不在烤的范围内的食材,发现只要是原始的食材,似乎都可以理解为一种烹饪方法上的创新。而如果把涮串换成另一个类别的食材总称,如:泡菜。这样就比较奇怪了。

 

我们会觉得两种解释似乎都有可能。

但是我们本身并不知道那种可能性更大,也不会直接选择可能性更大的解释。

 

似乎我们可以设计这样的逻辑:

烤(烹饪)的宾语可能是:肉类,动物,动物内脏,菌类,韭菜,水果(可能不好吃)等。

泡菜有一个菜的属性。蔬菜并不是适合烧烤的食材。所以烤泡菜的可能性较小。所以泡菜应该是单独销售的。

 

同理,如果出现“烤罐头”,我们可以视作搭配。但是必须处理下面这种可能发生的情况:

 

如何翻译荔枝with酱油

 

如果采用上面所说的:是否适合的逻辑,显然不可能正确翻译成荔枝蘸酱油。这种情况和烤水果很相像。如果在东北地区出现烤水果,是一种合理搭配。不过我们可能不应该从烤水果演化出烤罐头。但是我们可以从烤肉演化出烤羊肉。

或许烤羊肉就是把大块的羊肉放在火上烤???谁知道呢???