Watson Explorer 入门(11):配置词典和规则
来源:互联网 发布:java加密文件怎么解密 编辑:程序博客网 时间:2024/05/16 03:16
您可以创建语言资源,如字典和规则,包括在你的UIMA的管道分析文本和感兴趣的项目中,如姓名的城市。
大多数语言资源的源数据存储在数据库中。每个数据库是建立在编译文件中可以使用UIMA管道分析文本和感兴趣的项目注释。每当更新资源时,必须在数据库使用更新的资源分析文档之前,从数据库中重新编译其已编译的文件。
您可以通过导出数据库备份数据库。如果需要,可以从导出的数据库内容创建数据库,例如将数据库复制到另一台计算机。
Tip
Before you can perform the following operations on a dictionary or rules database, you must close the database by right-clicking the database in the Studio Explorer view and clicking Close.
- Synchronize a database with a source control repository
- Copy a database
- Edit properties of a database
- Import data into a database
词典
内容分析工作室使用多种类型的词典标识文本中的词汇并获取词汇的相关信息。
配置分割规则
配置分割规则词典,可以指示内容分析工作室如何标识文档中的文本。
字符规则
字符规则用于标识文本中特殊的实体,如电话号码、email地址、产品标识等。
解析规则
解析规则标识了文本模式,用于展示我们关心的特殊概念,例如人的名字、公司收购信息等。比如,可以创建标识IBM收购Lotus开发部门的规则。
0 0
- Watson Explorer 入门(11):配置词典和规则
- Watson Explorer 入门(13):配置中断规则
- Watson Explorer 入门(12):词典
- Watson Explorer 入门(7):配置 UIMA 管道
- Watson Explorer 入门(5):配置内容分析工作室(Studio)
- Watson Explorer 入门(6):开发和部署UIMA管道
- Watson Explorer 入门(8):测试 UIMA 管道
- Watson Explorer 入门(9):导出 UIMA 管道
- Watson Explorer 入门(1):非结构化数据相关概念
- Watson Explorer 入门(2):创建集合(Collection)
- Watson Explorer 入门(4):内容分析工作室(Studio)使用方法
- Watson Explorer 入门(10):导出 UIMA 管道至域适配搜索
- Watson Explorer 基础组件概述
- Watson Explorer 入门(3):创建搜寻器(crawler,数据爬虫)
- solr配置扩展词典和停用词典的问题
- Eclipse配置SQL Explorer插件和数据库
- python入门笔记-词典
- lucene配置IKanalyzer词典
- Latex 图片转为eps格式
- 20170513_一步一步写数据结构(二叉树的建立和遍历)
- 程序员编程能力层次模型
- 445端口入侵详解
- jeclipse中编译问题
- Watson Explorer 入门(11):配置词典和规则
- android 雷达图 蜘蛛图
- 排序:入门及桶排序
- TCP-IP详解之TCP的超时与重传4
- [leetcode: Python]278.First Bad Version
- URLError处理异常
- 条款17以独立语句将new置入智能指针
- Kmeans 图像分割 by python
- java static 函数 变量 代码块