向量数据库、主键存储引擎、高速网络 RDMA 框架……DolphinDB 版本更新啦!

本页以新闻形式发布 DolphinDB 版本更新,概览向量数据库、主键存储引擎与 RDMA 等重点方向,并包含发布日期信息。

Source: https://dolphindb.cn/news/detail/281

What this page covers

技能认证特训营第二期限时报名

页面顶部推广“技能认证特训营第二期”,并提供限时报名链接与福利优惠提示。

新闻与版本更新概览

以新闻形式发布 DolphinDB 版本更新,点出向量数据库、主键存储引擎与 RDMA 等重点方向并给出发布日期。

3.00.1 版本功能新增

介绍 3.00.1 版本新增能力,强调函数库扩展与针对业务与技术栈的新特性。

助力 FICC 业务:新增多个 FICC 相关函数

说明面向 FICC 场景新增分段线性回归与约束/无约束优化相关函数,并给出用途。

海量数据的向量检索:VectorDB

介绍 DolphinDB 在 3.00.1 推出的 VectorDB(以 TSDB 为底层存储)及其向量检索、索引持久化与混合搜索等能力,并提到与文档检索系统结合计划。

强化深度学习集成:支持 Tensor 数据类型

说明新增 Tensor 数据类型、tensor 转换函数,以及 LibTorch 推理插件与其安装/版本可用性说明。

保障主键唯一性,支持高负载写入:主键存储引擎

描述为 CDC/OLTP 同步场景推出 PKEY 主键存储引擎、创建方式与 primaryKeys/indexes 参数能力。

灵活应对多样业务逻辑:支持自定义分区函数

解释固定分区方式的局限,并说明 createPartitionedTable 与 create 的 partitionColumns 支持指定函数实现自定义分区,提供示例代码与结果展示。

网卡利用率提升:支持高速网络 RDMA 框架

介绍 RDMA 通讯优势、DolphinDB 3.00.1 通过 enableRDMA 配置启用,并声明相对 IPoIB 的网卡利用率性能提升及未来优化方向。

3.00.1 & 2.00.13 升级功能一览

汇总除重点功能外在 SQL、流计算、体验、分析能力与运维管理等方面的增强与优化条目。

SQL 兼容性增强

列出 SQL 语法兼容与性能优化项,包括 delete/join、insert into 分布式表、表注释、谓词下推与 join 性能提升。

流数据功能拓展

描述流计算引擎在响应式状态引擎、metrics 常数列、窗口触发与乱序处理等方面的增强。

数据库使用体验优化

说明新增 chimp 压缩算法支持与 TSDB Compaction 机制改进(Level 3/Level 4)以改善查询性能,并给出示例代码。

数据分析能力更强大

从语言特性、函数扩展与远程计算角度列出新增/改进能力,如三元运算符、BLOB 支持、JIT 矩阵索引、vectorAR、精度提升与 remoteRunCompatible。

运维管理功能强化

列出内存缓存清理、作业日志保留与调度参数、用户资源采样与其他安全/配置项增强。

未完待续(后续重点功能规划)

罗列后续版本计划支持的重点方向,如存算分离、外部分区表、TextDB、物联网引擎、多集群运维、接口扩展与性能提升。

Facts index

Entity Attribute Value Confidence
技能认证特训营第二期registration_linkhttps://www.qingsuyun.com/h5/e/217471/5/high
DolphinDB 版本更新新闻publish_date2024.07.04high
DolphinDBupdated_versions3.00.1 与 2.00.13high
DolphinDBintroduced_vector_engine向量数据引擎 VectorDB,用于海量数据的向量检索high
DolphinDBadded_data_structure_support支持张量(Tensor)数据结构high
DolphinDBadded_inference_plugin_support支持模型推理插件 LibTorchhigh
DolphinDBintegrated_network_framework集成高速网络 RDMA 通讯框架high
DolphinDBadded_storage_engine新增主键存储引擎(用于 CDC 场景实时高负载写入和高频更新)high
DolphinDBsupported_custom_partition_function自定义分区函数(更灵活适配多样业务逻辑)high
DolphinDBadded_financial_functions新增多个金融相关函数以助力 FICC 业务拓展medium
DolphinDB 新版本improved_standard_sql_compatibility提升对标准 SQL 的兼容性medium
DolphinDB 新版本enhanced_stream_computing_engine增强流计算引擎功能与易用性medium
DolphinDB 新版本upgraded_management从内存管理、作业管理和用户管理等方面升级数据库medium
DolphinDB 内置函数库function_count已接近 2000 个medium
piecewiseLinFitavailability在 3.00.1 与 2.00.13 版本中新增high
pwlfPredictavailability在 3.00.1 与 2.00.13 版本中新增high
piecewiseLinFitpurpose用于拟合分段线性回归函数high
pwlfPredictpurpose根据回归模型对数据进行预测high
brutepurpose通过穷举法在给定范围内最小化一个函数high
fminSLSQPpurpose使用顺序最小二乘编程方法找到目标函数的最小值high
fminNCGpurpose使用牛顿共轭梯度法对目标函数进行无约束最小化high
fminLBFGSBpurpose使用 L-BFGS-B 算法找到目标函数的最小值high
fminBFGSpurpose使用 BFGS 算法找到目标函数的最小值high
VectorDBintroduced_in_versionDolphinDB 3.00.1high
VectorDBunderlying_storage_engineTSDBhigh
VectorDBcapability通过对向量数据添加索引支持高效向量相似度查询,提高向量检索速度和响应时间high
VectorDBcapability索引持久化:将向量索引与其他二级索引(如 ZoneMap)一起持久化至磁盘,重启后可直接读取索引进行检索high
VectorDBcapability混合搜索:结合关键字检索(where 条件)与向量检索以提升搜索结果相关性(示例:电商按品牌/颜色并结合上传图片)high
向量检索技术role_in_system在检索增强生成(RAG)系统中用于从知识库找到与查询相关信息,为生成模型提供上下文支持high
DolphinDB AIstatus正在开发基于大模型的文档检索系统high
DolphinDBplan计划将向量数据库与 DolphinDB AI 结合以扩展知识库,并利用向量检索上下文提高生成结果质量与准确性medium
DolphinDB V3.00.1added_data_type新增支持 Tensor 数据类型high
tensorpurpose用于在 DolphinDB 中完成向量、矩阵、表等数据形式到 Tensor 数据形式的转换high
LibTorch 插件purpose支持使用 Tensor 数据类型以及 PyTorch 模型进行推理high
LibTorch 插件与 DolphinDBworkflow_claim可在数据库环境内完成数据查询、处理与模型预测,无需切换至 Python 环境medium
LibTorch 插件installation_availability目前可在 3.00.1 及以上的 Shark Server(DolphinDB 的 GPU 版本)中通过插件市场安装high
LibTorch 插件availability_change从 3.00.2 开始可在普通 DolphinDB Server 中使用high
PKEY (Primary Key Storage Engine)purpose适应 CDC 场景下实时高负载写入和高频更新需求,并保证主键唯一性high
创建主键存储引擎database_engine_parameter创建数据库时在 engine 参数新增引擎名“PKEY”high
PKEY 引擎primary_key_configuration支持通过参数 primaryKeys 配置主键,以保证数据唯一性和完整性并减少查询去重开销high
PKEY 引擎secondary_index_configuration支持通过参数 indexes 在非主键列上配置自定义索引键以加速查询性能high
createPartitionedTable / create 语句partitionColumns_supportpartitionColumns 参数支持为分区列指定函数,对分区列数据进行转换以实现自定义规则分区high
DolphinDB 3.00.1 网络模块rdma_enablement若网络设备支持 RDMA,只需通过配置项 enableRDMA 即可启用 RDMA 通讯架构high
DolphinDB RDMA 架构nic_utilization_performance_gain与 Linux 提供的 IPoIB 相比,网卡利用率约两倍性能提升medium
DolphinDBfuture_optimization未来将致力于深度优化序列化部分,以期真正实现零拷贝medium
SQL DELETE 语句 / sqlDelete 函数enhancement支持通过 join 来指定删除行high
分布式表enhancement增加对 insert into 语句的支持,并支持单行/批量写入high
setTableCommentpurpose为分布式表添加表注释high
基于规则的优化器enhancement优化实现并增强谓词下推支持high
多表 joinperformance_improvement提升性能medium
reactiveStateEngineenhancement支持对 array vector 列使用 prev 函数high
reactiveStateEngineadded_state_functions新增对例如 cumTopN、tmTopN 等 35 个 topN 状态函数的支持high
流计算引擎 metricsenhancementcreateReactiveStateEngine、createAsofJoinEngine 等的 metrics 支持指定为常数标量或向量high
createOrderBookSnapshotEnginenew_parameter新增参数 useSystemTime,支持使用系统时间触发快照输出high
TimeSeriesEngineout_of_order_handling支持基于数据窗口关闭时间设置延时以处理乱序数据high
chimp 压缩算法support新版本增加对 chimp 压缩算法的支持,可在 createPartitionedTable 与 createTable 为 double 列指定 compressMethodshigh
TSDB 存储引擎compaction_change引入 Level 3 Compaction 功能并引入 Level 4 概念,允许 Level 3 与 Level 4 的 Level File 同时参与 Compactionhigh
TSDB 存储引擎performance_impact通过 Level 3/4 Compaction 改善查询性能medium
DolphinDB 编程语言new_operator新增支持三元运算符 ?high
isDuplicateddata_type_support支持 BLOB 类型的去重high
parseJsonTabledata_type_support支持 BLOB 字段的解析high
JITenhancement支持处理矩阵索引,可通过 column/columns/row/rows 获取矩阵切片high
vectorARavailability新增支持时间序列模型函数 vectorARhigh
std/stdp/var/varp/skew/kurtosisenhancement提高计算精度high
intervalenhancement拓展对交易日历的支持high
remoteRunCompatiblepurpose与 remoteRun 功能相同,但对本地和远程数据库的版本不做限制high
clearAllCacheenhancement新增支持清理 TSDB 引擎相关的缓存high
jobLogRetentionTimepurpose用于定时删除作业的输出和返回值high
scheduleJobnew_parameters新增参数 priority 和 parallelism,用于设置定时任务优先级和并行度high
version 函数enhancement拓展返回的版本信息以便版本定位high
集群间异步复制安全性enhancement通过内部身份认证的用户无需明文指定用户密码medium
pluginServerAddrpurpose用于配置插件仓库地址,以便下载提速和团队共享high
DolphinDB 后续版本规划planned_features支持存算分离、外部分区表(如 Parquet 直接 SQL 查询分析)、TextDB 倒排索引、物联网点位管理引擎(窄表模式 ANY 类型)、多集群监控运维、嵌入式 Swordfish 增加 Python/Java 接口、提升 AI DataLoader 性能、提升 SQL 多表关联性能、回测引擎引入 Class 机制并通过 Class JIT 优化提升高频回测性能medium