随机抽取数据
来源:互联网 发布:jquery.min.js没有找到 编辑:程序博客网 时间:2024/05/16 12:49
从url列表文件中随机抽取一万个url,怎么做 ?当然要求就是要随机,即每个url被取中的概率相同。
开始我只能想到从指定记录数的列表中取,那样直接按概率取随机数确定就可以,这时也不用保存取出的url,可以直接输出。
假定有n条记录,要取m条,取第一条的概率是m/n,后面都是条件概率,前面已经取中k条的情况下该条取中的概率多少。
在记录未知的情况下,可能的做法是不停地校正概率。直觉上单个取中的概率越来越少,所以只需要考虑前面抽中的是否需要剔除,而不考虑漏掉的是否再补上。
开始一条一条的读,因为总是假定总记录数为当前的记录数,所以前1万条都取了。取第10001条时不考虑前面取的情况,按照1/10001的概率取,如果没抽到前面取到的还都保留,如果抽都则前面的10000个中必须按照1/10000的概率踢掉一个,就这样一直延续下去,就能得到分布平均的随机抽取了。数学上应该可以证明的,有时间我要写程序测试下。
- 随机抽取数据
- oracle 随机抽取数据
- Oracle随机抽取数据
- ACCESS如何随机抽取数据
- MySQL随机抽取一条数据
- SQL-建表-随机抽取数据
- Oracle 中实现随机抽取数据
- Oracle 中实现随机抽取数据
- Oracle 中实现随机抽取数据
- 随机抽取数据库8条数据
- 随机抽取符合的5条数据
- Sql Server 随机抽取数据效率优化
- sql server 随机抽取N条数据
- oracle_随机抽取N条数据
- Oracle 中实现随机抽取数据
- java随机抽取数组里的数据?
- 随机抽取数据作验证集validation
- sql 随机抽取几条数据的方法
- learning with errors理念
- 内存设备描述表的绘图技术--影子位图
- 路由播放器
- 做Android 系统/应用开发怎么可以不懂自动化测试
- 堆和栈的区别
- 随机抽取数据
- S3C6410 矩阵键盘 驱动移植及分析
- Linux 和 XP 可以互相 ping 通 SSH不能建立连接
- 将自组织网络与PCNN、CNN结合
- 一个matlab好网站
- 用独立成分分析滤波器进行表面缺陷检测
- Sqlserver 2000以单独用户运行
- 程序学习第七天
- 【破解作品】货比多家5.1绿色破解版/破解补丁