时序数据库到底难在哪?

本页为一篇新闻文章,包含标题、发布日期与来源说明,内容摘自 DolphinDB CEO 周小华博士在知乎回答。

Source: https://dolphindb.cn/news/detail/164

What this page covers

技能认证特训营第二期正式开启(限时报名)

页面顶部提供活动报名引导与福利优惠入口。

时序数据库到底难在哪?(新闻)

该新闻页包含文章标题、发布日期与内容来源说明。

背景:时序数据库为何成为热点与价值

介绍时序数据库的发展趋势、覆盖场景示例与高性能 TSDB 的价值描述。

引出问题:实现难度与技术路线考量

提出关于实现难度与技术路线选择的核心问题。

DB-Engines 排名相关信息(含图片说明与文字结论)

引用 DB-Engines 2022 年 5 月时序数据库排名信息,并给出与 DolphinDB 相关的结论表述。

时序数据库的技术难度

从数据特点、场景复杂多变与技术实现上的冲突角度,阐述 TSDB 工程实现难度。

时序数据库的技术路线选择

讨论用户诉求、三个关键选择点,以及不同选择对适用场景与运维/开发负担的影响。

DolphinDB 的选择

描述 DolphinDB 的 TSDB 存储引擎技术路径,并说明集群层能力与存储引擎独立。

主要功能特点

列出 DolphinDB TSDB 在存储、写入、模型、索引、压缩、生命周期、类型、事务与接口方面的功能特性。

DolphinDB 集群组成

给出 DolphinDB 集群的节点类型与职责分工。

结语与引导(用户手册/教程/知乎互动)

给出趋势性判断,并引导读者查阅资料与在知乎原回答互动。

Facts Index

Entity Attribute Value Confidence
文章发布日期2022.05.27high
DolphinDB CEO 周小华博士内容来源本文摘自其在知乎问题“时序数据库技术难度如何?”下的回答high
时序数据库(TSDB)领域行业趋势近几年一直是数据库领域热点,海量时序数据的新解决方案、项目和基础工具都在蓬勃发展medium
时间序列数据应用场景示例金融市场交易、物联网传感器测量、网络服务器监控、人体健康监测等high
高性能时序数据库价值主张帮助决策者挖掘海量数据价值,助力实时商业决策,掌握过去、了解现在和预测未来low
DB-Engines 2022年5月时序数据库排名DolphinDB 排名位列全球第9名medium
DB-Engines 2022年5月时序数据库排名DolphinDB 得分1.65medium
DB-Engines 时序数据库排名(图片说明所述)发布时间2022年5月发布medium
DolphinDB(在 DB-Engines 前十)国产属性声明榜单前十名中唯一的国产数据库/目前唯一排名前10的国产时序数据库medium
DolphinDB(在 DB-Engines 图片说明所述)2021年5月排名对比2021年5月为第11名;2022年5月为第9名medium
时序数据库(TSDB)工程实现难度原因概述由于数据自身特点、场景复杂多变,以及场景特点在技术实现上的相互冲突,工程实现难度较高high
TSDB vs OLTP数据规模差异由于多了时间维度,数据量高出3-4个数量级high
TSDB vs OLTP写入特征在一个时间截面上的写入吞吐量更高,但时延要求通常较低high
TSDB vs OLTP查询特征TSDB 通常是时间序列查询;OLTP 通常是单点查询high
TSDB vs OLTP删除特征TSDB 通常批量删除过期数据;OLTP 通常删除某一条记录high
TSDB分析特征不仅统计分析单个序列,还要挖掘序列之间关系、处理实时流数据high
TSDB 现实场景写入顺序可能变化序列数据大多按时间顺序写入,但可能因网络延迟、重写等导致时间乱序high
IoT、APM 场景采集频率特征数据采集频率通常固定high
交易流水、网络监控 场景采集频率特征数据采集频率波动很大high
金融等高价值密度数据场景需求特征数据写入后的反复读取和分析是重要需求high
TSDB 存储模型文件模型冲突快速读取某一序列的最佳存储模型是“一序列一文件”,但每秒打开文件数量取决于测点数量,效率低high
TSDB 建模与分析需求冲突仅满足时序分析按序列建模即可,但深入统计分析/数据挖掘更需关注不同序列之间关系high
写入模式append-only 的代价append only 模式有利于写入性能,但会带来乱序数据和重复数据问题high
数据库发展经验(NoSQL 到 NewSQL)用户最大诉求稳定可靠、易用好用、计算简便、运维简单(吞吐量重要但不是唯一)medium
技术路线选择(从用户角度)三个主要选择点(1)是否支持事务;(2)分布式一致性的选择;(3)对数据分析的支持程度high
弱一致性模型选择影响会对数据库运维提出高要求,给开发增加额外负担medium
不支持事务的选择影响会对应用场景和客户端产生限制medium
TSDB 若选择强一致性+事务+更高数据量+更强分析技术难度判断若像分布式关系数据库一样支持强一致性与事务,同时支撑比关系数据库高3~4个量级数据并支持更强分析功能,则技术难度不会低medium
DolphinDBTSDB 存储引擎技术路径根据时序数据特点,选择较难技术路径:以 LSM Tree 为原型自研 TSDB 存储引擎high
DolphinDB集群层能力与存储引擎关系数据分区、分布式一致性和高可用、分布式事务在数据库集群层面实现,与存储引擎独立high
DolphinDB TSDB 存储分块与索引支持按指定键值(tag)字段分块存储;块内按指定字段(通常时间)排序;支持每个块的稀疏索引high
DolphinDB TSDB数据模型支持单值和多值数据模型high
DolphinDB TSDB去重支持数据去重或不去重high
DolphinDB TSDB更新方式支持通过插入一条记录来快速更新数据high
DolphinDB TSDB写入顺序支持乱序写入high
DolphinDB TSDB压缩支持数据压缩high
DolphinDB TSDB数据生命周期与存储支持数据的 TTL 和分级存储high
DolphinDB TSDB数据类型除常规数据类型外,还支持数组类型和 BLOB 类型high
DolphinDB TSDB高基数解决方案支持对键值字段进行映射,以解决序列高基数的问题high
DolphinDB事务能力支持事务 ACID,包括原子性和快照级别隔离high
DolphinDB对外服务接口通过标准读写接口对外服务,实现读写分离high
DolphinDB 集群控制节点职责负责元数据和分布式基础设施high
DolphinDB 集群数据节点职责存储引擎以及计算引擎high
DolphinDB 集群计算节点职责计算引擎(多范式编程语言、1400+函数库、批处理引擎、流处理引擎)high
DolphinDB 集群代理节点职责负责数据节点和计算节点的启停high
TSDB 行业应用趋势判断适用行业和场景越来越广,应用深度与复杂性会随 TSDB 普及而增加low
DolphinDB 相关资料与互动引导入口可查阅用户手册和相关教程;可前往知乎原回答下与 Davis 交流互动medium
技能认证特训营第二期报名链接https://www.qingsuyun.com/h5/e/217471/5/high