时序数据库
来源:互联网 发布:实验室数据评价 编辑:程序博客网 时间:2024/05/29 08:57
时序数据的概念
时序数据简单的说, 就是随着时间流而不断产生的数据, 比如一台服务器的cpu负载, 或者一个应用的log文件等。 对于这种时序数据, 有一些常用的操作, 比如统计每分钟的平均值, 中位数等。
所谓时序数据库, 就是针对这类场景做了优化的一类数据存储查询系统。
又如百度无人车在运行时需要监控各种状态,包括坐标,速度,方向,温度,湿度等等,并且需要把每时每刻监控的数据记录下来,用来做大数据分析。每辆车每天就会采集将近8T的数据。如果只是存储下来不查询也还好(虽然已经是不小的成本),但如果需要快速查询“今天下午两点在后厂村路,速度超过60km/h的无人车有哪些”这样的多纬度分组聚合查询,那么时序数据库会是一个很好的选择。
看到这类数据处理基本是要对一个时间范围的数据, 根据时间段, 维度进行归类,做一些聚合运算。时序数据库要解决的问题就是如何能在海量数据中, 快速响应用户的此类查询。
时序数据库的概念
序数据库的一些基本概念(不同的时序数据库称呼略有不同)。
metric: 度量,相当于关系型数据库中的table。
data point: 数据点,相当于关系型数据库中的row。
timestamp:时间戳,代表数据点产生的时间。
field: 度量下的不同字段。比如位置这个度量具有经度和纬度两个field。一般情况下存放的是会随着时间戳的变化而变化的数据。
tag: 标签,或者附加信息。一般存放的是并不随着时间戳变化的属性信息。timestamp加上所有的tags可以认为是table的primary key。
如下图,度量为Wind,每一个数据点都具有一个timestamp,两个field:direction和speed,两个tag:sensor、city。它的第一行和第三行,存放的都是sensor号码为95D8-7913的设备,属性城市是上海。随着时间的变化,风向和风速都发生了改变,风向从23.4变成23.2;而风速从3.4变成了3.3。
时序数据库面临的挑战
链接
- 时序数据库
- 时序数据库
- 时序数据库简介
- 分布式时序数据库InfluxDB
- 分布式时序数据库InfluxDB
- 关于时序数据库
- 时序数据库分析
- 一款时序数据库 MyData
- 时序数据库InfluxDB
- 时序数据库(选摘)
- 时序列数据库之InfluxDB
- 时序列数据库之InfluxDB
- 时序数据库(I)-存储
- 查询时序数据库中的数据
- 时序
- 时序数据库 druid 简介之整体架构
- 基于时序数据库的GPS处理方案
- 时序列数据库之TSDB名录
- 设计模式-GOF行为模式(6-11)
- (转)亚马逊创始人贝佐斯:前进路上,善良远比聪明重要
- poj3069贪心
- Mantle的一个坑被我踩到了,快来围观
- Hadoop的特点与缺点
- 时序数据库
- git常见命令使用
- anyoffice 隧道排错指南
- 爱奇艺测试开发实习面经、阿里巴巴安全面经、CVTE c++开发面经
- 云计算免费视频教程:Bashshell脚本编程详解
- 2017暑假集训第三轮考试小结
- nodejieba安装记(Windows)
- 通过GSON解析复杂json数据(一)
- C++设计模式学习之代理模式