VLDB summer school(一)近似查询处理2——数学基础
来源:互联网 发布:强子纹身器材淘宝 编辑:程序博客网 时间:2024/05/21 19:33
VLDB summer school(一)近似查询处理2
这是 近似查询处理 系列的第二部分:AQP数学基础
有幸参加VLDB Summer School 2017,7天数据相关课程,收获良多,将知识记录并与大家分享。
一、近似查询处理(AQP)概括介绍
http://blog.csdn.net/kevinbetterq/article/details/76285606
二、AQP数学基础
简单抽样 :
<3,4,5,6,9,10,12,13,15,19>计算总值
开始抽样
- 模拟一个10面的骰子转动5次
- 每一次转动得到的数即为所给10个数中的相应位置的数
- 假设我们转到<6,3,5,3,9>,则为<10,5,9,5,15>
- 计算样本总值:44
- 放大倍数因子2
- 得到值为88(真实值为96)
这是最简单的抽样
Central Limit Theorem(中心极限定理):
中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。
推荐一个讲的很好的网址:https://zhuanlan.zhihu.com/p/25241653
Next:
Horvitz-Thompson估计 :
从偏差和方差到准确性 :
如何转化方差和偏差为准确性?我们需要一个“confidence bound”,形式的概率保证。
以下有几种方法:
三、通过取样的预测
四、从数据库中抽取样本
五、Bootstrap的介绍
六、Sketching的介绍
阅读全文
0 0
- VLDB summer school(一)近似查询处理2——数学基础
- VLDB summer school(一)近似查询处理1——概括
- Scala School 笔记(一)--基础
- 统计自然语言处理2----数学基础(一)
- ROS Summer School信息
- 数学基础 —— 向量基础(一)
- 组合数学——Codeforces Round #404 (Div. 2) D. Anton and School
- 数学笔记6——线性近似和二阶近似
- IPAM 计算机视觉 summer school
- 2014 Machine Learning Summer School
- 数据结构与算法分析(一) —— 数学基础
- 数学基础(一)——信息熵
- Codeforces Round #379 (Div. 2) F Anton and School(数学)
- 统计自然语言处理2----数学基础(二)
- RobotCraft 2017 第二届国际机器人学暑期学校 2nd Edition of International Robotics Summer School
- Machine Learning Summer School 视频列表
- CSWS 2013 Summer School slides and materials
- Summary about summer school of ICT
- mysql int bigint
- JavaScript语法
- MPI Maelstrom
- echart 基本设置
- Velocity模板引擎的简单使用
- VLDB summer school(一)近似查询处理2——数学基础
- Android Studio在创建/导入项目的时候,一直处于building “XXX”gradle project info的解决办法
- PHP常用的输出:echo,print,printf,print_r,var_dump,var_export
- CodeForces
- 最短路uva10917——虽然能ac,但是为什么用bfs就是错的???(已找到原因)
- imx6 适配DLP(864*480)输出
- neo4j使用
- spring boot定时任务的使用
- POJ-3087 Shuffle'm Up(DFS)