ICTCLAS分词之所有可能的组词情况

来源:互联网 发布:c语言循环结构编程题 编辑:程序博客网 时间:2024/04/27 19:30

求解所有的组词情况也就是二重循环遍历原子数组,具体代码因为要考虑好多种词性情况不好从整体上把握,现把伪代码粘贴如下:

for(int I=0;I<m;I++){  String s=A[I];   for(int j=I+1;j<m;j++){       s+=A[j];    if(s是一个词组){       把s加入到初次切分的列表中;       记录该词组的词性;       记录该词组所在表中的坐标位置及其它信息;    }    else       break;   }}

由此生成分词图表,也就是所谓的二维表:

 

原创粉丝点击