术语表
表 1 术语表
术语 | 解释说明 |
---|---|
标签(Tags) | 监控指标对应的元数据,一般用于描述数据来源。 |
标签集合(Tagset) | 一组“Tagkey=TagValue”的集合,可唯一确定一个设备。 |
采集指标(Field) | 时序数据中的采集指标,如温度、CPU使用率等,通常随着时间不断变化 |
持续聚合(Continuous Aggregation) | 时序场景下对时序数据进行周期性的降采样查询,并存储查询结果。用户需要查询降采样结果时,可以直接从 CA 执行结果中获取,而不需要对原始时序数据再进行聚合运算,提高了查询效率。 |
单值和多值模型 | 单值模型,指的是每一条数据中采集指标只有一个,即一行数据中只有一个 Field列。多值模型,指的是每一条数据中采集指标有多个,即一行数据中有多个 Field列。 |
分片(Chunk) | 管理分片组下部分设备的时序数据,为实际存储时序数据的单元。 |
分片组(ChunkGroup) | 为了便于对时序数据进行高效过期删除,通常将时序表按照时间范围拆分为多个分片组,以分片组为单位进行过期删除。分片组是逻辑单位,实际由多个分片构成。 |
监控指标项(Metrics/Fields) | 监控指标项,如CPU利用率,闲置内存等。 |
监控指标值(Point/Data) | 监控指标项在不同时间点产生的值。 |
降采样 | 时序场景下的降采样一般是指将一段时间内的多条时序数据聚合为一条数据,例如采集器上报的原始数据是一秒一条,将每一小时数据的平均值计算出来作为降采样后的数据,降采样后的数据精度变为小时级。 |
乱序写入 | 指后写入的数据的时间值小于先写入的数据的时间值。时序场景下的乱序写入,通常是针对 TagSet 相同的数据而言,即针对一个采集设备。同一个采集设备上报的数据是按照时间有序的,但是由于网络或其他原因,可能出现数据可能乱序,即同一个采集设备后到达的数据的时间值小于先到达数据的时间值。有一些时序数据库,如 InfluxDB 中同一个 TagSet 出现多条时间值相同的数据,如果有多条会出现数据覆盖,即后写入的数据会覆盖先写入的数据,查询时只会展示最后写入的那条数据。Uqbar 中允许同一个 TagSet 出现时间值相同的数据,时间值相同的多条数据查询时都会展示。 |
时间序列(Time Series) | 一台设备的一个监控指标项,随时间产生的多个指标值,又叫时间线。 |
时序表(Table) | 存储时序数据的接口表,用户通过时序表写入及查询时序数据。时序表按照时间范围分为多个分片组,每个分片组由多个分片组成。可以把时序表当做二级分区表的父表。 |
数据保留策略(Retention Policy) | 用于定义时序数据的存放规则和保留时间的策略。 |
无时间值写入 | 写入数据没有指定 time 列的值。 |