分词标准的选择

来源:互联网 发布:算法的复杂性分析 编辑:程序博客网 时间:2024/04/28 20:36

www.bijiaohao.com

www.jiucool.com.cn

 

比较好做的是垂直搜索,一般分词都是考虑

中文分词

用单字+词库检索的,对于顺序一般没有定义。

 

比如我搜索

 

红酒 得到的就是红+酒,定义优先级这个是必须得,但是也可能出现 酒红出现在结果里。

 

如果做大众搜索一般都会有用户检索两达到一定程度的词获得一个比较高的优先级,而且会作为匹配最好的词组出现了。

 

 

比如一个新的词汇的诞生。。。

 

以前没有这个词。但是现在有了,你给分开也没意义了。

 

开个玩笑就比如 春哥

 

。。。。