Map-Reduce是DolphinDB分布式计算的核心功能,通过mr函数实现数据并行处理与聚合。本文以股票分钟级数据计算最高价因子和tick级因子相关系数为例,展示了如何利用Map-Reduce高效处理大规模时序数据,分别实现1分54秒完成92.8G数据分析和4分20秒完成54.4G因子相关性计算。

Map-Reduce是DolphinDB分布式计算的核心功能,通过mr函数实现数据并行处理与聚合。本文以股票分钟级数据计算最高价因子和tick级因子相关系数为例,展示了如何利用Map-Reduce高效处理大规模时序数据,分别实现1分54秒完成92.8G数据分析和4分20秒完成54.4G因子相关性计算。

DolphinDB 脚本开头必须清理缓存和变量,以确保计算的可重入性和结果一致性,避免因残留变量导致错误。

DolphinDB插件开发指南:详细解析了插件开发中对象创建、Vector与Table数据高效读写、后台线程创建及权限管理等功能,提供丰富的C++ API示例,帮助开发者扩展DolphinDB系统功能并优化性能。

本文详细介绍了如何将 FineReport(帆软报表)与 DolphinDB 时序数据库进行集成,通过配置 JDBC 连接实现数据查询与可视化展示,为企业级报表分析和决策系统提供高效的数据支持。

本文介绍了EMQ X(一款高可用的分布式MQTT消息服务器)与DolphinDB时序数据库的集成方案。通过配置DolphinDB的StreamTable和规则引擎,EMQ X能够将接收到的MQTT消息(如客户端ID、主题、QoS和负载)实时存储至DolphinDB的分布式表中,实现物联网数据的持久化与高效处理。该方案适用于需要可靠消息传输和海量时序数据存储的物联网场景。

DolphinDB编程语言深度融合向量化、SQL、函数式与元编程四大范式,与分布式数据库和计算框架无缝集成,为海量时序数据分析提供高性能、高表达力的开发工具,大幅提升数据处理与建模效率。

DolphinDB提供常规、键值、流数据和MVCC四种内存表类型,支持共享与分区机制,分别适用于高速数据读写、主键查询、实时流处理和并发访问场景,为内存计算和实时计算提供灵活高效的存储方案。

DolphinDB内存数据表支持非分区与分区两种形式,可通过多种方法创建、加载及高效处理数据,分区表能充分利用多核CPU并行计算,显著提升查询与运算性能。

DolphinDB集群扩展指南:通过新增节点和扩展存储路径,在线提升计算与存储能力,实现业务无缝扩容与性能弹性增长。

DolphinDB高可用方案通过数据多副本、元数据Raft协议及客户端自动重连三重机制,确保数据库在节点故障时持续提供服务,满足金融、物联网等领域对业务连续性的严苛要求。
