2016-Q4目标

来源:互联网 发布:企业名录搜索软件 编辑:程序博客网 时间:2024/06/02 03:25
1.接口api:
  1-1.基于oltp的查询
     1-1-1.接口的的形式 (sql子集 or json封装 or 两者都有)
     1-1-2.具体实现细节需详细考虑
     (以上功能主要是用于满足oltp的crud功能,现阶段公司的业务组需要支持这些)
  1-2.基于搜索的查询(自定义josn封装)
     1-2-1.主搜索接口(该接口用于实现标准的搜索功能)
     1-2-2.下拉提示接口
     1-2-3.相关搜索接口(改接口也可并入到第一个接口中,目前分开设计,主要用于一些近义词、相关词的结果展示)
     1-2-4.拼音纠错接口
  1-3.基于nlp的功能接口()
     1-3-1.中文分词
     1-3-2.词性标注
     "周杰伦出生于台湾,生日为79年1月18日,他曾经的绯闻女友是蔡依林。"
     周杰伦/人名 出生/动词 于/介词 台湾/地名 ,/标点 生日/名词 为/介词 79年/时间短语 1月/时间短语 18日/时间短语 ,/标点 他/人称代词 曾经/副词 的/结构助词 绯闻/名词 女友/名词 是/动词 蔡依林/人名 。/标点
     1-3-3.实体名识别
     "詹姆斯·默多克和丽贝卡·布鲁克斯 鲁珀特·默多克旗下的美国小报《纽约邮报》的职员被公司律师告知,保存任何也许与电话窃听及贿赂有关的文件。"
     {詹姆斯·默多克=人名, 鲁珀特·默多克旗=人名, 丽贝卡·布鲁克斯=人名, 纽约=地名, 美国=地名}
     1-3-4.应用:自动问答、文本蕴涵、机器翻译


2.管理界面:
   2-1.索引配置(与表结构配置相似)
   2-2.违禁词、近义词等基础配置;
   2-3.黑白名单配置
   2-4.等等


3.分析界面:
   3-1.搜索热词分析;
   3-2.搜索效果评估分析;
   (二和三也可统一成一个)


4.持久层:
   4-1.elasticsearch(第一版应该先基于这个去做,之后的可以丰富起来)
     4-1-1.集群的详细性能测试;
     4-1-2.权限(数据安全)、监控的增加;
     4-1-3.docker化,减少运营压力;
     4-1-4.源码分析(这个的优先级并非最低,可与上述内容并行)
   4-2.上面很多功能es可能无法解决,如nlp的一些功能接口,这边需要引入别的东东


5.程序监控:
    这里的监控是上面监控的一个汇总
0 0
原创粉丝点击