特征工程(如何合理地把非数值特征转换成数值特征)
来源:互联网 发布:正交矩阵的行列式 编辑:程序博客网 时间:2024/05/17 02:46
现在我理解的特征工程的意义是:如何把非数值特征转换成数值特征?
1、假如有一个属性是职业,有这三种职业,教师、公务员、工程师,现在要用一个基于线性回归的算法,来训练模型,假如f(x,y)=ax+by,a,b代表权重,x代表职业这个属性值,那么如何给这个x赋值?
解决方案:
1、人工无脑的赋值,比如教师=1,公务员=2,工程师=3,但是这样科学吗?假设教师和工程师的特征比较相似,这样显然不合适。但是,这种方法依然在用,解决这种不合理的办法是,世界上有许多计算词汇相似度的方法,他能判别各种词汇的相似度,我们根据词汇相似度然后再给他们赋值。
2、离散赋值,比如把职业这个属性再分为三类
阅读全文
0 0
- 特征工程(如何合理地把非数值特征转换成数值特征)
- 什么是特征工程?如何进行特征工程?
- 特征工程(1)--特征工程是什么?
- one-hot enconding,类别型特征,非数值型特征。
- 特征工程(sklearn)
- 特征工程(二)
- 特征工程(一)
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 特征工程
- 初始化mysql数据库提示缺少Data:dumper模块解决方法
- 如何获取 docker 容器(container)的 ip 地址
- 我的第一篇博客
- Java垃圾回收机制
- scp指令和ssh指令
- 特征工程(如何合理地把非数值特征转换成数值特征)
- 我的Linux 学习之路
- vue表单提交
- QScrollArea使用的小问题
- bootstrap table实现server分页序号连续(当前页从上一页的结束序号开始)
- activiti根据当前节点获取下一个UseTask节点
- JavaScript预解析过程
- The Triangle 【nyoj-18】【动态规划】
- RefreshScrollviewLayout下嵌套ViewPager横向滑动冲突解决