算法概括

来源:互联网 发布:网络综艺收视率 编辑:程序博客网 时间:2024/04/29 10:59

算法

机器学习

数据挖掘


关于机器学习的要素:

1.特征工程(特征的提取,转换,选择)

提取:转换:方便计算,

选择:


2.有监督学习(分类,回归)

通过已经有的数据获得未知的


3.无监督学习(聚类)

画圈圈:在空间上的分布

注重数据之间的相似性,空间相似度的你拟和


数据挖掘:

1.数据预处理(数据清洗,特征构造)

2.分类(决策树(if else),最近邻(同流合污(?),svm(线性回归,几何划分),贝叶斯:(超几何分布)概率模型)

3.聚类(基于距离,基于密度(蚂蚁),基于图,基于概率(根据注意))

4.关联规则/Apriori(啤酒尿布,错字推荐)

5.离群点检测(安全维护常用,不正常访问)


书籍:信息检索导论,机器学习