对象和语义分类体系(V200705)
来源:互联网 发布:oracle数据库用户权限 编辑:程序博客网 时间:2024/05/04 16:27
本分类体系是在973语义分类体系的基础上改进的。
改进有:
1、根据我的理解进行细分。
2、允许分类“重叠”。之所以允许重叠,是因为知识库中不少事物属性的界限是不容易分离的,而且有些情况下,重叠会更好。
3、根类别从01开始,它的子类别是0101、0102……
4、对于这些分类,我直接称为“对象”。不仅仅把它当作语义分类,有些领域方面的东西,比如新闻、文章等的所属类别,也是从这些对象中引入。基于知识库的需要,某些对象会有实例,比如人物(个人)、公司机构等,这些会另作解释。
对象Object {ID,对象名-名词ID,索引index,解释} 例,{1,事物,01,xxxx}
对象属性ObjectFeature {ID,索引index,feature(XML)} 这里的feature定义的只是规则,这些规则通常而言是为知识库服务的。对象属性中的feature需要人工定义,以个人为例:
<个人>
<基本信息>
<姓></姓>
<名></名>
</基本信息>
</个人>
实例**Instance {ID,对象索引,属性attribute(XML)},**指某个具体的事物,对于个人的实例,为IndividualInstance。
--------------------------------------------------------------------------
【名词】
01 事物 /* [+entity] */ (根节点:1;终端节点:58;非终端节点:16)
0101 具体事物 /* [+physical_object,-abstract,-time,-space] */
010101 生物 /* [+animate,-part] */
01010101 人类 /* [+human] */
0101010101 个人:小孩 律师 工人 农民 弟弟 文盲 /* [+individual] */
010101010101 基本信息:姓 名 英文名 出生日 身份证
010101010102 扩展信息:别名 字 号 种族 籍贯 卒日
010101010103 通讯:手机 电话{家庭:号码,工作:号码} 地址{家庭:地址,单位:地址}
010101010104 成长:
01010101010401 教育:
0101010101040101 学前教育
0101010101040102 幼儿园
0101010101040103 小学:{学校 老师(科目:老师ID)入学日期 离开日期}
0101010101040104 初中:{学校 老师(科目:老师)入学日期 离开日期}
0101010101040105 高中:{学校 老师(科目:老师)入学日期 离开日期}
0101010101040106 大学,级别指{本科,硕士,博士}
{学校 级别 学号 专业 老师(科目:老师)入学日期 离开日期}
0101010101040107 培训,各类培训,包括成人教育和电视教育
{机构 培训内容 时间}
01010101010402 工作:
01010101010403 技能:
01010101010404 创作物:
01010101010405 人际:
0101010101040601 亲:
0101010101040602 戚:
0101010101040603 发小:
0101010101040604 青梅竹马:
0101010101040605 伙伴:
0101010101040606 朋友:
0101010101040607 知己:
0101010101040608 夫妻
0101010101040609 情人
0101010101040610 同学:
0101010101040611 校友:{xxx届:人ID,关系值}
0101010101040612 同事:
0101010101040613 合作者:
0101010101040614 其他:主要指陌路人或仇人之类,需要设定关系值
01010101010406 Cyber:
01010101010407 兴趣:
01010101010408 偏爱:
01010101010409 愿望:
01010101010410 生活:经历{时间 地点 内容}
010101010105备注:
{姓 名 别名 字 号 种族 籍贯 出生日 卒日 住址 手机 电话 Cyber 职业 单位 职称 关系 成果(0101020307 创作物) 技能 兴趣 (喜爱的)颜色 动物 植物}
0101010102 人群:人民 群众 委员会 少先队 团伙 /* [+society,-location] */
0101010103 机构:corporga(corporation+organization)/* [+organization,+location] */
010101010301 大中型商业机构:工厂 公司 企业 集团
{名称 地址 网址 领域 经营范围 部门 法人}
010101010302 救助机构:红十字会 监狱 孤儿院 医院
010101010303 娱乐服务设施:商店 商场 商城 影院 游乐园 公园 博物馆 网吧 歌/舞厅 酒吧 旅馆 饭店 茶馆 茶楼 旅行社 夜总会 报亭 剧团 音乐厅
010101010304 教育机构:学校 培训
01010101030401 幼儿园
01010101030402 小学
01010101030403 初中
01010101030404 高中
01010101030405 大学
{校名 地址 网站 校训 校长{人:时间} 学院 部门 机构}
01010101030406 培训机构
010101010305 互利机构:联合国 欧盟
010101010306 暴力机关:军队 警察局 派出所
010101010307 宗教:寺院 教堂
0101010104 拟人:
01010102 动物 /* [+animal] */
0101010201 兽: /* [+beast] */
狗 狼 猪 牛 羊 老虎 豹子 狐狸 兔子 马 驴 猴子 鲸 骆驼
0101010202 鸟:鸡 鸭 麻雀 杜鹃 /* [+bird] */
0101010203 鱼:鲤鱼 河豚 鲸 泥鳅 /* [+fish] */
0101010204 昆虫:蚯蚓 知了 蟑螂 /* [+insect] */
0101010205 爬行动物: /* [+reptile] */
青蛙 乌龟 甲鱼 蛇 鳄鱼
0101010206 传说 传说中的兽鸟等
朱雀 玄武
01010103 植物 /* [+plant] */
0101010301 树:白杨 水杉 芭蕉 /* [+tree] */
0101010302 草: 狗尾巴草 含羞草 蒲公英 /* [+grass] */
0101010303 花:牡丹 芍药 杜鹃 映山红 /* [+flower] */
0101010304 庄稼:蔬菜 小麦 高粱 棉花 /* [+crop] */
0101010305 传说:传说中的植物
0101010306 水果:待考虑
0101010307 低植:灌木 藓类
01010104 微生物:细菌 霉菌 病毒 /* [+microbe] */
010102 非生物 /* [-animate,-part] */
01010201 自然现象 /* [+natural_phenomenon] */
0101020101 可视现象:火 电 光 风 雨 云 虹 晚霞 /* [+visible] */
0101020102 可听现象:声音 雷鸣 /* [+audible] */
01010202 自然物 /* [+natural_object] */
0101020201 地表物:原野 沙漠 山 山洞 /* [+surface,+land] */
0101020202 水域物: 江 河 湖 海 /* [+water] */
0101020203 天体:太阳 月亮 星星 /* [+constellation] */
0101020204 矿物:煤矿 原油 铁矿 /* [+underground,+material] */
0101020205 元素:元素周期表中的东东 /* [+chemical_element] */
0101020206 基本物质:水 土 灰 空气 /* [+substance,+element] */
01010203 人造物 /* [+artifact] */
0101020301 服饰:西装 围裙 围巾 裤子 鞋 /* [+clothing|+covering] */
0101020302 食品:菜 饭 面包 补品 /* [+food] */
010102030201 吃:
010102030202 喝:
0101020303 药品:药 维生素 /* [+medicine] */
中药
西药
维生素
0101020304 建筑:楼房 别墅 礼堂 会议室 水库 庙 /* [+building] */
010102030401 房屋
01010203040101 房间
010102030402 设施
0101020305 器具 /* [+instrument,+device] */
010102030501 用具:剪子 刀子 伞 拖把 脸盆 衣架 /* [+tool] */
010102030502 交通工具:车 船 飞机 自行车 /* [+vehicle] */
01010203050201 车
01010203050202 船
01010203050203 飞行器
010102030503 武器:大炮 机关枪 鱼雷 /* [+weapon] */
010102030504 家具:桌子 椅子 沙发 /* [+furniture] */
010102030505 乐器:钢琴 吉他 长笛 鼓 /* [+musical_instrument] */
010102030506 电器:电视 电风扇 空调 /* [+electronic_equipment] */
01010203050601 家用:电视 电风扇 空调
01010203050602 工用:机床
010102030507 文具:钢笔 圆珠笔 纸 /* [+writing_implement] */
01010203050701 笔
01010203050702 墨
01010203050703 纸
01010203050704 砚
01010203050705 尺规:直尺 圆规
010102030508 运动器械:羽毛球 足球 哑铃 单杠 /* [+sprots_equipment] */
010102030509 Cyber:网站 博客 IM Email /* [+cyber] */
{网站 博客 Email QQ MSN YahooMessenger ICQ 签名 其它}
网站:站名:网址 ,email:mail地址,MSN:号码,其它:工具名:号码或地址
0101020306 原材料:木材 钢筋 水泥 玉石 玻璃 /* [+material,+stuff] */
0101020307 创作物:{领域 作品名 作者 作品} /* [+creation] */
010102030701 文字 {题目,作者}
01010203070101 小说
0101020307010101 科幻
0101020307010102 奇幻
0101020307010103 武侠
0101020307010104 纪实
0101020307010105 情感(亲情 友情 爱情)
0101020307010106 都市
0101020307010107 历史
0101020307010108 心理
0101020307010109 推理 侦探
0101020307010110 哲理
0101020307010111 同人
01010203070102 散文
01010203070103 诗歌
01010203070104 词曲
01010203070105 戏剧
01010203070106 剧本
01010203070107 歌词
01010203070108 评论(文学评论 电影评论等)
010102030702 绘画(油画 水墨画 铅笔画等)
010102030703 乐谱
010102030704 雕刻(冰雕 石雕 印章等)
010102030705 手工艺(泥人 编织 织绣等)
0101020308 计算机硬件:鼠标 显示器 主机 服务器 /* [+computer,+hardware] */
0101020309 计算机软件:操作系统 数据库 /* [+computer,+software] */
0101020310 符号:签名 路标 箭头 /* [+symbol] */
0101020311 钱财: 美元 利息 保险 国库券 股票 珠宝 /* [+asset] */
010102031101 货币money
010102031102 珍宝treasure
010102031103 票证coupon
010102031104 费用expenditure
010102031105 酬金payment
010102031106 资金fund
0101020312 票证:发票 结婚证 执照 毕业证 /* [+written_material] */
0101020313 读物:
010102031301 书籍
010102031302 期刊
010102031303 薄册:相册
010102031304 文档:笔记 日志 日记 周记
010102031305 信件
010102031306 标志
01010204 排泄物:汗 尿 粪便 奶水 眼泪 /* [+body_waste|+body_substance] */
01010205 构形: 粉末 长方形 圆 窟窿 孔 洞 泡 /* [+shape] */
010103 构件 /* [+part] */
01010301 生物体构件:头 脸 鼻子 嘴 耳朵 头发 血液 骨头 /* [+body_part] */
01010302 非生物构件:梁 屋檐 车闸 车筐 /* [-body_part] */
0102 抽象事物 /* [+abstract,-physical_object,-time,-space] */
010201 事件:学潮 往事 会议 典礼 战争 车祸 火灾 /* [+event] */
实事 政治
01020101 事情
0102010101 事务
0102010102 问题
0102010103 原因
0102010104 过程
0102010105 结果
01020102 现象
010202 领域:社会 经济 文教 法律 科学 艺术 /* [+field,+social_group] */
01020201 社会
0102020101工作 {单位,部门,职位,时间}
0102020102旅行 {方式,地点,同行者,时间} 方式:随旅行社:旅行社,自费(驾车,背包客)
0102020103 时尚小资
01020202 经济
01020203 教育,学校:{地区ID}{学校ID}
0102020301 胎教
0102020302 学前教育
0102020303 幼儿园
0102020304 小学
0102020305 初中
0102020306 高中
0102020307 大学
0102020308 培训,各类培训,包括成人教育和电视教育
0102020309 考试
01020204 法律
01020205 科学(含 数学)
01020206 艺术
01020207 文学
01020208 技术(工程)
0102020801 计算机
010202080101 硬件
010202080102 软件
01020208010201 游戏
0102020801020101 单机
0102020801020102 网络
01020208010202 办公
01020208010203 软件开发
01020208010204 网络
01020209 历史
01020210 自然
0102021001 地理
0102021002 野生
010202100201 动物
010202100202 植物
01020210020x自然保护区
010202100x 环境保护
01020211 军事
01020212 健康
0102021201 身体
0102021202 心理
0102021203 养生保健
0102021204 美容
01020213 医学
0102021301 中医
0102021302 西医
0102021303 护理
01020214 体育
01020215 影视
01020216 音乐
01020217 娱乐
01020218 动漫
01020219 房产
01020220 汽车
01020221 魔法
010203 法规:法律 条约 协议 制度 规章 合同 协议 条文 /* [+law,+rule] */
待考虑
01020301 制度
01020302 法律
01020303 条约
01020304 协议
01020305 规矩
010204 生理:炎症 瘟疫 疾病 /* [+physiological_state] */
01020401 疾病
01020402 炎症
01020403 瘟疫
010205 意识:意图 幻想 兴趣 主意 见解 情感 目的 /* [+cognition|+feeling] */
{施事者:人,受事者:人或其他:名称,内容}
01020501 意图/目的
01020502 愿望/理想
01020503 幻想
01020504 兴趣
01020505 情感
01020506 主意
01020507 见解
01020508 偏爱
01020509 思想
0102050901 念头
0102050902 方法
010205090201 规划
0102050903 目的
0102050904 道理
0102050905 立场
0102050906 知识
010206 人际:
01020601 亲:直系亲属,父、母、儿女、祖父母、外祖父母
01020602 戚:其他亲戚
01020603 发小:从小一起长大的朋友
01020604 青梅竹马:
01020605伙伴:儿时的玩伴,因各种原因,没有一起长大
01020606朋友:志同道合、志气相投者
01020607 知己:无论红颜蓝颜、同性异性;包括伯乐
01020608 夫妻
01020609 情人
01020610 同学:同班同学
01020611 校友:{xxx届:人ID,关系值}
01020612 同事:公司里的同事,不分上下级
01020613 合作者:因为利益联系在一起;有利益相交
01020614 其他:主要指陌路人或仇人之类,需要设定关系值
010207 信息:话 密码 声明 口信 借口 语录 /* [+Information] */
01020701 语言
0102070101 符号
0102070102 文字
0102070103 词语
0102070104 语文
010207010401 新闻
01020702 音乐
01020703 图像
01020704 表演物
01020705 实例
01020706 通讯
010208 属性 /* [+attribute,+property] */
01020801 量化属性: /* [+measurable] */
长度 宽度 高度 深度 厚度 尺寸 粗细 总量 面积 坡度 密度 松紧 硬度 浓度 距离 迟早 速度 久暂duration 湿度 温度 价格 黏度 容积 体积 功率 电量 电压 电阻 频率 热量 音量
01020802 模糊属性 /* [-measurable] */
0102080201 人性:胆量 勇气 脾气 身姿 舞步 作风 /* [+property_of_human] */
010208020101 外观
美丑 姿势 洁净 胖瘦 仪态 装束 风格 表情
010208020102 特性
年龄 名声 举止 价值 印象 意志 胆量 智慧 能力 力量 气量 等级 身份 职位 势力 亲疏 性别 出身 姓名 编号 前景 归属 辈分 分歧 境况 贫富 体格
0102080202 事性:境况 形势 状态 原委 环节 /* [+description_of_event] */
010208020201 外观
010208020202 特性
编号 前景 次序 正反 场面 可能 情况
0102080203 物性:性能 效用 品种 式样 /* [+property_of_object] */
010208020301 外观
形状 明暗 清浑 美丑 样式 光洁度 颜色 浓淡 气味 味道 景象 洁净 物理状态 风格
010208020302 特性
新旧 年龄 真伪 好坏 质量 强度 难易 音质 内容 正误 程度 价值 印象 效用 主次 必要 等级 标准 幅度 利弊 编号 性能 趣味 前景 风气 归属 类型 来源 位置 方向 界限 正反 异同 整缺 空满
//0102080204 技能:{主事者,领域:内容:内容,技能名称,水平}
010209 权利 rights
010210 责任 duty
0103 时间 /* [-abstract,-physical_object,+time,-space] */
010301 绝对时间:宋朝 三国 二十世纪 /* [+specific] */
010302 相对时间:昨天 当代 古代 今天 /* [+underspecific] */
0104 空间 /* [-abstract,-physical_object,-time,+space] */
010401 方位:东南 前面 视角 /* [+direction] */
010402 场所:浙江 西湖 黄山 /* [+location|+region] */
01040201 国
01040202 直辖市
01040203 直辖市的区、县
01040204 省份
01040205 市、县
01040206 乡镇
01040207 村
01040208 街道
01040209 小区 居民楼
01040210 山川
01040211 江河湖泊
【形容词/副词】
02 性状 /* [+value_of_attribute] */ (根节点:1;终端节点:33;非终端节点:3)
0201 事性值:紧急 突然 困难 容易 错误 费时
0202 物性值
020201 视感:亮 醒目 清晰 混浊
020202 触感:紧 松 粗糙 滑 柔
020203 色感:红 黄 鲜艳 素淡
020204 味感:酸 甜 苦 辣 淡 香 臭
020205 听感: 响亮 低沉 刺耳
020206 形感:方 圆 尖 美 丑
020207 浓度:浓 稀薄
020208 热度:热 冷 凉爽
020209 速度:快 慢
020210 长度:长 短
020211 高度:高 矮 低
020212 宽度:宽 窄
020213 深度:深 浅
020214 厚度:厚 薄
020215 硬度:硬 软
020216 湿度:潮湿 湿润 干燥
020217 粗细:粗 细
020218 新旧:新 旧
020219 松紧:松 紧
020220 大小:大 中 小
020221 真假:真 假
020222 好坏:好 坏 有利
020223 强弱:强 弱
020224 价值:贵 便宜
020225 内容:空洞 晦涩 清楚 浅显
020226 水平:精通 熟练 高 中 低 入门 未接触过
0203 人性值
020301 年龄值:年轻 幼小 老
020302 德才值:善良 博学 幼稚 优雅
020303 关系值:崇拜 尊敬 亲密 熟 友善 一般 疏远 陌生 仇恨 敌对
0204 空间值
020401 一维空间值:远 近
020402 二维空间值:平 斜 弯
020403 三维空间值:拥挤 杂乱 整齐 满 壮阔
0205 时间值:古老 久远 短暂 早 晚
【动词】
03 运动 (根节点:1;终端节点:14;非终端节点:1)
0301 关联:是 有 包括 等于 姓 含 存在
0302 心动:企图 认识 赞成 吝惜 重视
0303 行动
030301 自变:死 病 /*主体不涉及他物,自身状态性质发生变化*/
030302 促变:增加 减少 /*主体涉及他物,使他物状态性质发生变化*/
030303 自为:笑 休息 咳嗽 /*主体不涉及他物,自身没有变化*/
030304 对待:哀求 爱护 爱惜 /*主体涉及他物,但不影响他物*/
030305 遭受:遭到 受到 蒙受 /*主体涉及他物,受他物影响*/
030306 创造:写 创建 描绘 /*主体创造生成某物,使得某物从无到有*/
030307 消除:消灭 杀死 铲除 /*主体消除某物,使得某物从有到无*/
030308 自移:游泳 走 跑 /*主体不涉及他物,自身有位移*/
030309 搬移:扔 搬 推 扛 /*主体涉及他物,促使他物位移*/
030310 给予:卖 送 发 告诉 /*主体给予他人物品或信息*/
030311 获取:买 取得 学习 /*主体从他人那儿取得物品或信息*/
030312 相互:商量 交谈 相遇 /*主体数量不小于2*/
- 对象和语义分类体系(V200705)
- 语义分类体系
- Boost.Bind用法详解(一) 2008-05-09 15:50:50| 分类: C++ |字号 订阅 Boost.Bind 为函数和函数对象提供了一致的语法,对于值语义和指针语义也一样。
- 符号体系与语义
- 读《基于中文维基百科链接结构与分类体系的语义相关度计算》
- 基于语义连贯性实现主题挖掘和分类
- 对象语义与值语义
- 值语义与对象语义
- 值语义与对象语义
- AVStream对象体系和描述符
- [转]机器学习中距离和相似性度量分类体系
- 机器学习中距离和相似性度量分类体系
- 自然语言中的名词语义和编程语言的对象系统
- asp体系的分类
- 多维知识分类体系
- 距离度量分类体系
- Google广告分类体系
- 语义Web和语义网格
- 如何删除数据表中重复的记录
- java文件操作大全
- JAVA文件操作详解
- string 转 int 函数
- myeclipse5.1GA下WebService开发日记(1)
- 对象和语义分类体系(V200705)
- [WinForm每日一帖] UltraGrid打印预览
- 在ie 中 使用 ocx (三)
- uclibc与uc-libc的区别
- 最近开始读lwIp的源代码
- Asp.net把UTF-8编码转换为GB2312编码
- 对Access数据库的并发(异步)访问控制和测试
- Unicode与字符集函数
- Windows系统自带FOR命令的使用简介