让高频数据真正“落地”——海富通基金基于 DolphinDB 的行情中心与多因子研究平台建设
客户背景
海富通基金长期深耕量化投资领域,量化团队与 IT 部门共同承担着全公司的量化策略研发、行情管理与技术支撑任务。随着市场结构加速演变,策略对高频行情的依赖程度不断增加,如何从海量的 Level-2 数据中提炼出可解释、可度量、可复用的信号,成为策略团队最核心的关注点之一。
在研究日内波动、刻画市场结构、分析订单流行为的同时,团队也需要将这些高频信息进一步转化为分钟级、日级的低频序列,用于组合层面的风险管理及长期信号分析。此外,多因子模型的不断扩展,也对计算稳定性、加工链路透明度与数据一致性提出了更高要求。
在这样的背景下,团队希望重塑底层技术架构,打造一套能够同时处理高频、低频、多因子加工的统一平台,使研究链路更加顺畅。
面临挑战
原先,海富通基金主要面临以下挑战:
- 高频行情的存储方式分散、冗余大,采样频率不统一、格式差异化明显,使不同研究人员在进行日内分析或转换低频序列时,需要投入大量时间进行预处理。随着数据规模不断累积,读取速度、加工效率开始成为瓶颈,策略研发周期受到明显影响。
- 将高频数据降维为分钟级或日级序列,看似只是降频操作,实际上涉及聚合、多字段加工、指标校验等一系列计算链路,对于计算框架的稳定性提出较高要求。特别是在日终任务中,团队需要在规定窗口内完成波动率计算、成交结构分析、低频信号输出,一旦耗时过长就会影响第二天的调仓准备。
- 多因子模型的扩展也为整个系统带来了额外压力。不同因子之间的计算周期、依赖数据、加工流程不完全一致,如何在同一框架下保持数据一致性、计算可复现性,是研究团队必须解决的问题。为了提高模型的稳定性和分析深度,团队还需要评估相对复杂的动量类因子与结构性信号,对底层引擎的计算表现与数据准确性提出了更高要求。
因此,海富通团队需要一套能够整合存储、计算与调度的统一系统,以避免重复劳动,消除链路不透明带来的时间损耗。
DolphinDB 解决方案
在全面评估业务需求并进行严格选型后,海富通基金选择 DolphinDB 作为核心技术底座,对现有量化基础设施进行重构。
在数据管理层,团队将 Level-2 行情统一落盘至 DolphinDB,利用其高压缩比的存储引擎与列式结构管理方式,使长期历史行情的存储更紧凑、加载更迅速。数据格式得以标准化,跨策略团队的协作成本大幅降低。
在计算层,DolphinDB 被用作高频数据的降频与加工引擎。研究人员可以在平台内快速完成从毫秒级到分钟级、日级的数据转换,利用系统内置的窗口函数、聚合操作与时间序列处理能力,构建稳定的日终数据加工流程。加工后的低频数据通过 DolphinDB 的 Python API 输出至研究端,为信号分析、组合层交易等流程提供统一的数据来源。
与此同时,团队也利用 DolphinDB 灵活的脚本语言与并行计算能力,对动量类、结构类等因子进行评估,测试数据一致性、计算速度以及对大规模行情的适配能力。所有加工链路均可在 DolphinDB 环境中记录与复用,为后续因子扩展及性能评估提供必要的技术基础。
方案效果与价值
方案落地后,海富通基金在数据处理效率、研究方法的稳定性及跨团队协作效率方面获得了显著提升。
高频行情得到统一管理后,原本分散在多个系统中的文件处理、格式转换和质量校验被压缩到较短时间内完成,研究人员能够更快地拿到可直接使用的分钟级与日级序列,为日终分析、指标计算和信号生成奠定了可靠基础。在计算效率方面,DolphinDB 的时序计算引擎显著缩短了降频与指标加工的耗时,使日终任务更加可控。波动率计算、成交结构分析、低频信号输出等环节在稳定窗口内完成,避免了因任务堆积导致的次日延迟,使研究节奏更加可预测。
在多因子模型的评估方面,研究人员可以高效地验证新的因子假设,不论是市场动量类信号还是结构类因子,都能在相同框架下进行对比与扩展。这种一致性使模型的可解释性增强,也让因子库建设更加系统化。
依托 DolphinDB,海富通基金真正构建起了一体化量化基础设施,从日内行情分析到组合层调仓的链路更加紧凑、策略验证更加高效。同时,也为后续策略创新奠定了稳定的技术底座。
如果您是:
寻求更优行情处理与实时分析能力的券商、资管机构;
需要高效量化研究平台与强大回测引擎的量化团队;
致力于构建实时风险管控系统的银行、金融科技公司;
任何需要处理海量时序数据、追求极速分析的行业创新者……
欢迎访问官网下载并试用 DolphinDB!