关键词过滤系统(一)系统功能探究

来源:互联网 发布:算法设计与分析第一版 编辑:程序博客网 时间:2024/06/05 13:25

一).支持文本模式

           对英文与数字的支持的支持   如关键词是 fuck 则 fuck你妹可以被匹配到,fucktt则不会被匹配到,fuck11会被匹配到

相对来说1fuck1   关键字1会被匹配到  而 文本11 关键词1也无法匹配

           支持繁体字,提供对照词典(ChineseDictionary)

           仅仅支持简体英文

                                              * 65-90   :A-Z
                                              * 97-122  :a-z

          数字词典   基本数字的支持

          扩展的数字,英文,中文词典。

          全角半角词库



二).匹配模式

    1。精确完全匹配 (词典为一个默认的实现,不支持文本转换)

          匹配情况:文本全部与关键词匹配

    2.   包涵匹配        (词典为一个默认的实现,不支持任何的文本转换)

          匹配情况 : (忽略位运算情况) keyword : 你好   文本: 你好啊亲  则文本被匹配到                         

         1.2   并没有过滤词典,所以文本的特殊情况都不支持

   3.模糊包涵匹配      

          所有文本变体都支持,全角半角为默认的过滤转换器


三)。支持位运算

  支持  & | ~ 运算, 关键词是

  ~不能作为关键词的开始

   如下文本    你好亲爱的朋友    你好|巴巴可以匹配到  你好&巴巴无法匹配   你好~朋友 也无法匹配     切不支持括号运算符。

   亲~你^朋友  可以匹配到  

文本  你好亲爱的朋^友  关键词 你好~朋^友   无法匹配到 ,说明~之后的文本被当作一段来处理  你好~朋^友~亲无法被匹配到,则说明~ 后的~也有效。


四).对外以WebService方式提供服务

提供WebService 方式供给外部系统访问,部署时部署在多台服务器上,使用Notify作为机器间通知机制。



五)。对外界支持

外界可以设置自己的一级应用点,一级应用点下面可以设置多个二级应用点,二级应用点可以加入通用词库。

并且加入 Label 来管理关键词,同样使用筛选器来统一管理关键词,关键词可以被推荐进入通用词库,关键词 标签 应用点都有启用和禁用状态


原创粉丝点击