机器学习-近9年双色球开奖数据的频繁项集

来源：互联网发布：阿里云ip 编辑：程序博客网时间：2024/06/17 13:40

绝大多数的人都有过一夜暴富的梦想，购买双色球便是实现这种梦想的方式之一，因此各种专家号推荐层出不穷。

在这里我想尝试用机器学习的方法来揭开双色球的秘密，即一切用数据说话。本着娱乐至上的目的为大家带来一次“杀号定胆”的游戏。

数据采集

双色球历史数据： 2009～2017的1229期开奖数据
采集方式： Python 网络爬虫
具体代码： 文末有相关链接

相关算法： Apriori 或者 FP-Growth
数据类型： 标称型
双色球数据结构： [‘02’,’13’,’22’,’23’,’26’,’33’,’b02’]
算法结果： 输出历史开奖的单个号码和组合号码的出现频率

通过数据分析后，我将算法结果总结了一份双色球历史开奖数据报告，大家各取所需哈。

红色球单个号码依据随机均匀分布，出现频率为：2/11
蓝色球单个号码依据随机均匀分布，出现频率为：1/16
以下号码除33，b02（最不常出现号码）外，出现频率均超过平均频率

偷偷告诉你们一个秘密，听说红01和蓝12更配哦。

从数据来看，双色球号码是比较服从均匀分布的；小玩怡情，大玩伤身，好了，我要去买一注最常出现的和一注最不常出现的双色球了。

相关代码链接：数据收集以及分析算法

阅读全文

1 0