优达机器学习:聚类
来源:互联网 发布:淘宝代销可以改价格吗 编辑:程序博客网 时间:2024/05/29 03:31
K-MEANS的最初中心点选择对最后的分类效果有很大关系,比如下图出现的聚类,就有很大的问题
练习: 聚类特征
- salary
- exercised_stock_options
练习:部署聚类
### cluster here; create predictions of the cluster labels### for the data and store them to a list called predfrom sklearn.cluster import KMeanskmeans = KMeans(n_clusters=2).fit(finance_features)pred = kmeans.predict(finance_features)
练习:使用3个特征聚类
- 是的,有4个测试点的聚类变了
### the input features we want to use ### can be any key in the person-level dictionary (salary, director_fees, etc.) feature_1 = "salary"feature_2 = "exercised_stock_options"feature_3 = "total_payments"poi = "poi"features_list = [poi, feature_1, feature_2, feature_3]data = featureFormat(data_dict, features_list )poi, finance_features = targetFeatureSplit( data )### in the "clustering with 3 features" part of the mini-project,### you'll want to change this line to ### for f1, f2, _ in finance_features:### (as it's currently written, the line below assumes 2 features)for f1, f2,_ in finance_features: plt.scatter( f1, f2 )plt.show()
练习:股票期权范围
- max:34348384
- min:3285
import numpy as npstocklist = []for item in data_dict: stock = data_dict[item]['exercised_stock_options'] if stock != 'NaN': stocklist.append( stock )stocklist = np.array(stocklist)print np.max(stocklist)print np.min(stocklist)
练习:薪酬范围
- max:1111258
- min:477
import numpy as npsalarylist = []for item in data_dict: salary = data_dict[item]['salary'] if salary != 'NaN': salarylist.append( salary )salarylist = np.array(salarylist)print np.max(salarylist)print np.min(salarylist)
练习:聚类更改
阅读全文
0 0
- 优达机器学习:聚类
- 优达机器学习:回归
- 优达机器学习:神经网络
- 优达机器学习:文本学习
- 优达机器学习:朴素贝叶斯
- 优达机器学习:决策树练习题
- 优达机器学习:异常值
- 优达机器学习:交叉验证
- 优达机器学习:评估指标
- 优达机器学习:误差原因
- 优达机器学习:特征缩放
- spark机器学习-聚类
- 机器学习10聚类
- 【机器学习】--Kmeans聚类
- 机器学习-学习笔记 聚类
- 优达机器学习:数据集与问题学习
- 优达机器学习:学习曲线与模型复杂度
- 【机器学习】(7):聚类
- Python global全局变量只能在函数中没做global申明,可以引用但修改会报错。
- 【Scikit-Learn 中文文档】神经网络模型(无监督)- 无监督学习
- java 序列化
- 项目笔记:中期报告
- Okhttp 源码解析
- 优达机器学习:聚类
- 美国的儿童新娘:这世界的黑暗,又何止RYB?
- kafka producer java API的实现
- 【Scikit-Learn 中文文档】交叉验证
- unity3D一些常见小问题(时不时更新)
- 关于faac的一点使用方式
- 完美平方
- c++11多线程编程参数传递若干问题
- Qt编码风格