web数据挖掘学习1
来源:互联网 发布:全智允新公司js 编辑:程序博客网 时间:2024/05/22 09:03
万维网特征:
数据大,主题广泛内容丰富。
各种类型的数据(结构化表格,半结构化网页,无结构化文本,多媒体)
网络信息异构
权威网页
噪音:一张网页上的有用信息和噪声2、各界评论
万维网的动态性
数据挖掘:分类(监督学习)聚类(无监督学习)关联规则挖掘、序列模式挖掘
步骤:
预处理:噪音、数据的不完整性,方法:采样和选择特定属性来降低数据量降维
挖掘:
后续:将发现的模式进行评估,找到有用的模式
WEB挖掘
来源:结构挖掘超链接结构(搜索引擎)、内容挖掘网页内容(情感分析)、使用挖掘日志 (点击流数据的预处理)
0 0
- web数据挖掘学习1
- 关于监督学习(web数据挖掘)
- 关联规则-web数据挖掘学习2
- web数据挖掘(学习笔记)-观点挖掘
- 数据挖掘 -- Web挖掘技术
- 数据挖掘学习笔记(1)
- Web数据挖掘
- Web数据挖掘
- Web数据挖掘
- 《web数据挖掘》
- Web数据挖掘综述
- web数据挖掘
- 数据挖掘学习笔记1:引论
- 机器学习与数据挖掘1
- 数据挖掘学习1----随机森林
- 数据挖掘学习书籍推荐 1
- 数据挖掘学习笔记-分类(1)
- 数据挖掘学习笔记1_Apriori
- 《Windows核心编程》---Interlocked原子访问系列函数
- javascript之回调函数的理解
- 正则表达式学习笔记 之 group()和group(i)的区别
- JS和AS交互
- 设置python 模块调用路径
- web数据挖掘学习1
- scala讲解---变量,函数
- hdoj-2717-Catch That Cow
- K-th Number【POJ2104】——主席树
- Activiti 由bpmn文件到BpmnModel实体类转换
- 学习android笔记(3):自定义动画
- 统一架构模型(UAM)
- 最短路算法之Dijkstra算法
- ubuntu下配置NFS