问题记录

来源:互联网 发布:淘宝代缴公积金靠谱么 编辑:程序博客网 时间:2024/06/05 18:24

1.直接计算设备间的条件概率有一定道理,有另外的值得参考的数学方法:


    1.1 计算均值与标准差

       1.1.1  计算所有两设备间的概率之和,然后求取均值,然后计算标准差,根据环球科学上面的超过4倍标准差就比较罕见的说法(假设是正态分布?)判断哪些比较奇异;

       1.1.2  求所有设备停电次数之和,求每个设备停电次数之和(所有时间、一小时内、一天内,以发现是突发还是经常,在时间上停电的分布式什么,通过异常的时间点情况下是否有停电的点也是异常的情况),然后上游的总次数肯定小于下游的总次数;停电次数最多的肯定处于下游或者属于独立的群落;文档给出的条件概率实则和左面的叙述本质上一样的,至于以小时为计算单元,除实际的考量及具有争议的网格化外,实在找不出概率与群落间的联系,即使概率本身也没必要计算,除非要用条件概率计算两设备间的关系。


    1.2 有向图计算、谱聚类可以用于有向图?


   1.3 基于行的考查、基于列的考察——一个时间段所有设备的关系,进行计分或积分


   1.4 先聚类,再分析——聚类维度问题与时间窗宽选取



2.农业供求、产销、需求等地理信息、进货信息、国外主要产地信息、工厂利润、风险与保险、天气等等大数据


3.诈骗短信自动识别与拦截系统:借鉴文本分类、垃圾邮件分类系统与白名单黑名单以及共享垃圾邮件来源大数据库,公安+电信+政府三方出资这个系统


4.股市、金价、汇率、油价、利率、经济增长率等等之间的趋势图


5.

0 0
原创粉丝点击