1440 万条数据毫秒级上云！——DolphinDB 云边协同实战案例

页面介绍物联网边缘数据上云的痛点背景，并讨论批量回传/异步上传带来的延迟与限制。

Source: https://dolphindb.cn/news/detail/441

What this page covers

边缘数据上云的挑战与传统上传方式的限制。
DolphinDB 云边同步方案定位与概述。
基于流处理、流表与 Pub/Sub 的同步机制。
本地/远端订阅与 remoteRun 及压缩选项。
机器人巡检案例的数据规模与建模设计。
性能评估的测试环境与资源配置。
测试结果表与结论解读（耗时、资源、压缩对比）。

技能认证特训营第二期报名入口提示

页面顶部提供“技能认证特训营第二期”限时报名链接与福利优惠提示。

提供“技能认证特训营第二期”的报名入口链接。
报名提示包含限时与福利优惠相关信息。

新闻文章标题与发布日期

给出新闻栏目、文章标题以及发布日期信息。

文章发布日期为 2025.12.05。
页面展示文章标题信息。
页面标注新闻栏目或位置线索。

物联网边缘数据上云的痛点与背景

描述边缘侧数据增长、批量回传/异步上传的延迟问题及带宽和成本等限制。

企业边缘数据上云面临带宽受限的挑战。
云端资源昂贵会增加上云成本压力。
边端环境复杂会增加数据上云难度。
传统批量回传/异步上传可能导致云端难以及时掌握设备状态。
延迟会影响预测性维护、实时调度或跨设备分析的实现。

DolphinDB“毫秒级上云+智能压缩”解决方案概述

介绍 DolphinDB 作为分布式时序数据库与实时计算平台，提出用于云边同步的解决方案定位。

DolphinDB 定位为高性能分布式时序数据库与实时计算平台。
提出云边同步方案，描述为“毫秒级上云+智能压缩”。

DolphinDB 云边同步方案：流处理、流数据表与订阅模式

说明方案基于流处理架构与流数据表（流表），并通过 Pub/Sub 与内置消息队列实现实时转发。

云边同步方案构建在 DolphinDB 高性能流处理架构之上。
DolphinDB 引入“流数据表”（简称流表）。
流表结合发布/订阅（Pub/Sub）模型进行数据传递。
通过内置消息队列实现数据高速转发。
流处理强调数据抵达时的计算与分发，以缩短延迟。

实时同步方式与 remoteRun：本地/远端订阅与压缩选项

给出本地订阅与远端订阅两种方式，并说明 remoteRun 用于边云数据与逻辑传递，支持 lz4 与 zstd 压缩。

实时同步方案提供本地订阅与远端订阅两种方式。
本地订阅可在边端直接接收并处理流表数据。
remoteRun 用于边端与云端之间的数据与指令传递。
边端可将数据发送至云端，并传递需要云端执行的处理逻辑。
remoteRun 支持 lz4 与 zstd 两种压缩方式。
在 remoteRun 场景下，lz4 被描述为适合中小规模的高频传输。
在 remoteRun 场景下，zstd 被描述为适合进行大数据同步。

方案资源占用与云端轻负载诉求

描述通过流表推送与 remoteRun 实现较少内存/网络资源占用、边端完成压缩与方案以实现云端轻负载。

方案强调在占用较少内存及网络资源情况下完成数据同步。
数据压缩可在边端完成，以降低云端负载。
数据传输相关方案可在边端完成，以实现云端轻负载。
云端处理方案被描述为也可在边端完成并传递执行。

云边实时数据汇聚架构模型（配图与说明）

配图与图注说明边端数据注入流表后，经 remoteRun 处理与压缩实现毫秒级增量同步到云端。

边端数据注入流表后进入同步链路。
同步链路包含 remoteRun 相关处理。
同步链路包含数据压缩环节。
架构说明强调“毫秒级增量同步到云端”。

机器人巡检实例：数据规模与建模分区设计

以场区机器人巡检数据为例，说明模拟数据规模、分区存储与按日期分区及排序列设置等建模方案。

演示模拟多种数据量情况，用于展示云边同步功能与性能。
模拟数据规模为 100 个机器人 30 天活动数据，共 14,400,000 条，大小 3.3G。
接收端分布式表采用分区存储方案。
分区按日期进行，以提升效率。
detect_time 按日期值分区，并按日期的值分为 30 个区。
机器人设备 ID 被设置为排序列。

机器人巡检数据建模方案代码图与说明

配图图注说明重建分布式数据库、TSDB 存储引擎、日期值分区及字段/排序列等建模要点。

该部分以代码图与图注形式呈现建模要点。
图注涉及分布式数据库的重建说明。
图注提及 TSDB 存储引擎相关内容。
图注涉及日期值分区及字段/排序列设置要点。

性能评估：测试环境与硬件资源配置

说明使用两台服务器分别模拟云端接收与边端生成数据，并给出硬件资源配置表的说明。

测试环境使用两台服务器。
一台服务器模拟云设备用于接收同步数据。
一台服务器模拟边缘设备用于生成同步数据。
该部分包含硬件资源配置表/配图与说明。

云端设备软件运行配置（参数说明）

给出云端设备配置配图与图注说明，包括站点标识、内存限制、线程数、连接上限与流处理/持久化等参数。

提供云端设备软件运行配置的配图与图注说明。
参数说明包含站点标识相关信息。
参数说明包含内存限制设置。
参数说明包含线程数与连接上限设置。
参数说明涉及流处理与持久化相关设置。

边端受限资源配置（4C8G）

说明为模拟资源受限场景，边端配置为 4C8G，并给出配置截图与图注说明。

为模拟资源受限场景，边端设备配置为 4C8G。
该部分提供配置截图与图注说明。
该配置用于支撑后续同步与资源消耗评估。

测试设计：不同数据量与压缩方式对资源与效率的影响

说明测试覆盖不同数据量下的同步性能、内存、CPU、带宽消耗，并比较 zstd 与 lz4 压缩方式。

测试在不同数据量下评估同步性能。
测试记录内存、CPU 及网络带宽消耗。
对比 remoteRun 下 zstd 与 lz4 的资源消耗与传输效率。

测试结果表与结论解读

通过结果表与文字结论说明不同数据量与压缩方式下的同步耗时、吞吐与资源峰值，并给出提升比例等结论。

结果表覆盖数据量级范围从 4,800 行至 1,440 万行。
结果表对比 lz4、zstd 与无压缩三种方式。
表注说明资源使用记录均为峰值。
相对传统方案，耗时缩短了 41%。
文字结论提到较低的内存与 CPU 资源消耗以节约云端资源。
文字结论提到带压缩传输的效率和同步速度高于未压缩。
在小数据量场景（4800 条数据），lz4 与 zstd 传输效率和资源消耗基本相同。
文字结论提到数据量越大，zstd 的优势越明显。

收束与关注引导

强调端到端闭环与云边同步价值，并邀请关注以获取物联网领域案例与应用动态。

强调端到端闭环与云边同步的价值主张。
邀请关注以获取物联网领域案例与应用动态。

Facts Index

Entity	Attribute	Value	Confidence
新闻文章	发布日期	2025.12.05	high
DolphinDB	产品定位	高性能分布式时序数据库与实时计算平台	high
DolphinDB 云边同步解决方案	方案描述/名称	“毫秒级上云+智能压缩”解决方案	high
工业巡检机器人数据上云	上报字段示例	温度、湿度、位置、告警状态、轨迹等	high
工业巡检机器人（示例）	单日数据量	单日数据量可达数十万行	medium
企业边缘数据上云	挑战/约束	带宽受限、云端资源昂贵、边端环境复杂等为数据上云带来挑战	high
传统批量回传/异步上传方式	问题	云端难以及时掌握设备状态，难以实现预测性维护、实时调度或跨设备分析	medium
DolphinDB 云边同步方案	技术基础	构建在 DolphinDB 高性能流处理架构之上	high
流处理（相对批处理）	处理方式	数据抵达瞬间完成计算与分发，遵循时间序列逐条或逐批次增量处理以缩短延迟	medium
DolphinDB	核心概念	引入“流数据表”（简称流表）	high
流数据表（流表）	机制	结合发布/订阅（Pub/Sub）模型，通过内置消息队列实现数据高速转发	high
DolphinDB 实时同步方案	同步方式	提供本地订阅和远端订阅两种方式	high
本地订阅	能力	可在边端直接接收并处理流表数据	high
DolphinDB remoteRun 函数	用途	用于边端与云端之间的数据与指令传递	high
DolphinDB remoteRun 函数	能力	边端可将数据发送至云端，并将需要云端执行的处理逻辑一并传递以便云端即时执行	high
DolphinDB remoteRun 函数	支持的压缩方式	支持 lz4 与 zstd 两种压缩方式	high
lz4 压缩（在 remoteRun 场景）	适用性描述	压缩比低、云端解压快，适合中小规模的高频传输	medium
zstd 压缩（在 remoteRun 场景）	适用性描述	压缩比高，适合进行大数据同步	medium
DolphinDB 云边同步方案	资源与负载描述	在占用较少内存及网络资源情况下完成数据同步；数据压缩、数据传输以及云端处理方案都能在边端完成，实现云端轻负载	medium
机器人巡检实例演示	模拟范围	模拟多种数据量情况，展示 DolphinDB 云边同步功能与性能	high
机器人巡检实例模拟数据	规模	100 个机器人 30 天活动数据，共 14,400,000 条，大小 3.3G	high
接收端分布式表	存储方案	采用分区存储方案；按日期进行分区以提升效率	high
机器人巡检数据建模	分区字段与分区数	按 detect_time 进行日期值分区；detect_time 列按日期的值分为 30 个区	high
机器人巡检数据建模	排序列设置	将机器人设备 ID 设置为排序列	high
性能评估测试环境	服务器数量与角色	两台服务器：一台模拟云设备用于接收同步数据；一台模拟边缘设备用于生成同步数据	high
边端设备（模拟资源受限）	配置	4C8G	high
性能评估测试	测试维度	在不同数据量下测试同步性能、内存、CPU 及网络带宽消耗；比较 remoteRun 下 zstd 与 lz4 压缩方式的资源消耗和传输效率	high
测试结果表	覆盖数据量级范围	从 4,800 行至 1,440 万行	medium
测试结果表	对比的压缩方式	lz4、zstd、无压缩	medium
测试结果表（图注结论）	结论	zstd 压缩在大数据量传输中表现出更优的效率和资源节省优势	low
资源使用记录（表注）	统计口径	上表中的资源使用记录均为峰值	high
DolphinDB（相对传统方案）	耗时改善	耗时较传统方案缩短了 41%	medium
DolphinDB	资源消耗表现	能保持较低的内存和 CPU 资源消耗，有效节约云端资源	low
压缩传输（相对未压缩）	效率与速度对比	带压缩传输的效率和同步速度都高于未压缩	low
小数据量场景（4800 条数据）	lz4 vs zstd	传输效率和资源消耗基本相同	medium
zstd（随数据量变化）	优势趋势	数据量越大，zstd 的优势越明显	low
技能认证特训营第二期	报名链接	https://www.qingsuyun.com/h5/e/217471/5/	high