知识图谱项目札记
来源:互联网 发布:批量写淘宝宝贝卖点 编辑:程序博客网 时间:2024/06/05 13:34
时间:2017年7月10日
1.获取领域知识:
找相关领域专家获取项目所需的已经大量存在的结构化的知识数据。(别说找不到,只要有相关学科,一定能找到一些,自己去整理实在太耗费时间和精力,并且不敢保证其科学性),以作后续处理。
2. 对这些结构化的数据进行处理:
[1]对这些结构化的数据再次结构化:
按我们所需的数据结构进行重新整理。人工?还是直接使用数据库进行数据处理获得我们所需的结构数据?个人认为最好当然是使用数据库进行处理,不过如果人多的话,人工整理更可控,因为可以尽可能将数据的结构处理成我们最需要的。
要做的工作:
1.对所需数据进行拍照,并且粘贴进PDF文件中。
2.使用OCR软件:ABBYY FineReader(试用版即可)对PDF文件进行扫描识别,保存成可编辑的Excel文件。
3.对Excel中的数据进行校对。校对的同时,按照我提供的数据格式进行数据处理。
附件:数据格式
[2]对整理好的已经满足我们需求的电子化的数据进行自动抽取。
因为很多数据可能是文本描述的,而我们需要将这些文本中的数据中我们所需的实体抽取出来。目前能想到的方法是:使用正则表达式进行抽取。
目前还没有做到这里,未完,待续 。。。
阅读全文
0 0
- 知识图谱项目札记
- 技术文章 | 项目实战:如何构建知识图谱
- 项目实战:如何构建知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱
- 知识图谱知识推理
- 知识 | 金融知识图谱
- 科普 | 典型的知识库/链接数据/知识图谱项目
- 中文知识图谱
- 知识图谱演进
- 知识图谱搜索引擎
- 对PopupWindow的封装
- MySql视图原理讲解与使用大全
- Mysql 遇到的各种问题
- JAVA调用GDAL实现影像格式转换,以tif to jpg为例
- Spring学习笔记(一)
- 知识图谱项目札记
- Centos7.1安装步骤图解
- iOS 获取手机倾斜角度
- 开发一个SSO服务器
- UOJ #219 [NOI2016 D1T1] 优秀的拆分 [95分]
- CVE-2017-6008浅析-HitmanPro内核池溢出漏洞(Win7)
- LoRa无线sx1278&LoraWan协议剖析
- QT的软件的下载地址
- 上最全的Unity面试题(含答案)