汉日词典结构的研究(一)---源语言分析

来源:互联网 发布:古墓丽影崛起优化如何 编辑:程序博客网 时间:2024/05/12 04:55

作者:胡霞

    针对目前普遍存在的英汉电子词典来说,以日语为源语的汉日词典的组织结构要更为复杂。其中的日文汉字、假名混排、交错查找的现象是较为繁琐的问题,也就是说,在汉如电子词典中多数词条都存在着两个关键字。从时间和空间上有效解决日文汉字、假名的双重查询问题是日汉电子词典查询的关键。本文将主要针对这个问题介绍一种方便、实用的日汉电子词典组织结构。

一、源语言分析

日语属于粘着语,它不同于其他语种,主要表现为:

 

1、 汉字、假名混合排列:
日文不同于中文,在同一篇文章中,汉字和假名同时存在,不同的用户根据个人的习惯,可同时使用汉字或假名书写同一个日文单词,这就要求词典应具备汉字、假名双重查询能力,例如:
わたしは学生です。
也可以写为: 私は学生です。
2、 部分单词书写格式唯一:
虽然日文存在汉字、假名混排现象,但还有大量单词只以汉字或假名一种形式出现,例如:
です、これ —→ 只以假名形式出现;
3、 存在大量同音词:即同音异义词,例如:
がくせい—→学生、楽聖、学制;
じしょ—→辭書、地所、自書、字書;
在词典中,存在大量的同音词,有的词甚至产生几十个同音词,如果词典以单词的读音(即假名)为关键字从词典中查找有关单词,只能找到其中一个,其他词都匹配不上;
4、 存在大量多义词:即读音不同的同形词,例如:
日本—>にほん/にっほん
同样,在词典中存在着大量这种多义词,且这些单词中有些是读音不同,语意相同的,有些是读音不同,语意也不相同的,如果词典以日文汉字为关键字建立索引进行查找,也只能找到其中的一个,其他的都匹配不上;
从上述日语现象分析,日汉电子词典如果分别以日文汉字和假名为关键字进行有序排列,采用日文汉字、假名相结合的查询机制进行搜索将是一种最佳的查询方案。
原创粉丝点击