数据挖掘组件化总结

来源:互联网 发布:php sha1加密 编辑:程序博客网 时间:2024/06/06 09:24

上课老师讲的还是对理解算法很有帮助


1 任务(1 频繁模型模式 (频繁模式+异常点)2描述性建模(全体点)聚类  3   预测性建模(单点)分类(概念性数据)+回归(数值型数据))


2 要得到的模型模式结构( 1线性回归模型2层次聚类项模型3频繁序列模型 。 集合 ,序列,决策树,图)


3评价函数(似然,误差,准确率,召回率,置信度,可信度,信息熵,基尼系数)


4搜索+优化方法(搜索从模式族里选取最佳模型(1贪婪2分枝界定3宽度深度优先遍历)优化基于模型发现最优参数(1梯度下降2EM期望最大化3最小二乘法4爬山法))


5 数据组织和管理(1分块(分治)2 压缩(时间换空间)3索引(空间换时间)4hash既包含压缩又有索引意味)

原创粉丝点击