数据挖掘-开发流程

来源:互联网 发布:visio画数据库关系图 编辑:程序博客网 时间:2024/05/21 13:22

数据收集

用户访问行为数据业务数据爬虫第三方数据

预处理

   数据清洗和转换   将类别数据->数值(1-of-k)文本提取数据 (词袋法或TF-IDF)处理图像或音频(像素 声波 音频 振幅<傅里叶变换>)数值数据->类别数据,如年龄分段对数转换特征正则化、标准化,保证同一模型不同输入变量的值域相同组合或转换现有变量,生成新特征,如平均数

数据采样

特征工程

建模

分类回归聚类

模型评估

准确率精确率召回率ROCAUC

部署上线

模型监控和反馈

迭代优化

新业务

原创粉丝点击