计算网页停留时间的平均时长
来源:互联网 发布:sql语句实现分页查询 编辑:程序博客网 时间:2024/05/01 12:06
需求:现在有好多用户访问某个网页的停留时间,要计算平均时长。
求均值是不太合理的,因为有的时间特别的长,这样的时间应该是噪音数据,这样计算的均值感觉就偏大。
我感觉应该先找到事件的分布,然后根据分布计算它的期望。
首先把数据分成几个区间,然后计算每个区间内事件发生的频次:
(参考这个:http://jingyan.baidu.com/article/f3ad7d0fffa41509c2345b6e.html)
我首先画出了数据分布的直方图:
分布特别不均匀,从累计概率可以看出第一组数据就站了87%。
下面我们只要前87%的数据:
这个跟指数分布好像:
把这两个叠加到一张图上:
假设服从指数分布,指数分布密度函数为
把数据从小到大排列,中间的数就是中位数。
看下面的例子:
https://www.zhihu.com/question/27496436
只能简单粗暴的取分位数了。
下图是所有的数据的统计结果:
下图是访问时间<300的数据的统计结果:
不论是取中位数,还是求中间部分的均值,结果都是差不多的,而且感觉也较合理。而且用全部数据算,和去掉感觉不合理的特别大的数据算的结果也是差不多的。
所以我感觉可以用中值代表页面停留时间的平均时长。
python的代码和分析数据的excel表在这:
https://github.com/zhouna/ml_python/tree/master/webPage
参考:
http://blog.jobbole.com/93336/
https://blog.oldj.net/2012/11/01/time-on-page/
http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html
- 计算网页停留时间的平均时长
- hive计算网页停留时长
- JS计算网页停留时间
- JS计算网页停留时间代码分享
- 计算用户在页面停留的时间
- JS计算网页停留时间实例代码(www.jbxue.com)
- 队列应用银行排队问题模拟:计算客户的平均停留时间和等待时间以及每个客户的时间信息,两种方法实现
- 计算页面停留时间
- 用Hive分析函数lead计算用户页面的停留时长
- 进程平均周转时间的计算
- C语言实现 计算句子的平均句长
- 计算平均时间
- js计算用户在页面的停留的时间
- 网站的停留时间
- 访问数,每次访问页数,平均停留时间,跳出率
- Oracle数据库中平均事务响应时间的计算公式
- 为什么场景的平均响应时间比是实际操作的响应时间要长
- 启动linux时在Enabling Swap Space都要停留时间很长
- C++ zip文件的解压与压缩
- for循环中pairs与ipairs的区别与联系
- 编程练习(第十七周)
- C# 两个独立exe程序直接通信
- .NET Expression 从零开始四:结构化异常处理(SEH)
- 计算网页停留时间的平均时长
- 霍尼韦尔C300-DCS系统学习课件
- C6678的中断控制器
- Coin Change
- 基于安卓6.0开机启动动画到Launcher的流程
- Android自定义View,你必须知道的几点
- 电阻屏驱动基础理论
- ubuntu安装google拼音输入法的便捷方法
- win7 64位操作系统 VS2015下配置OpenCV3.2.0教程