复杂因子秒级计算,文谛资产是这样做到的... | 上海文谛资产管理有限公司 | 客户案例 | DolphinDB

该页面以客户案例标题点明主题:聚焦文谛资产在复杂因子计算方面的实践。

Source: https://dolphindb.cn/customer-case/detail/3

What this page covers

技能认证特训营第二期报名促销

页面顶部展示技能认证特训营第二期开启与限时报名链接的促销提示。

导航与位置:客户案例 > 上海文谛资产管理有限公司

提供回到客户案例列表的导航链接与当前案例对应客户名称。

案例标题:复杂因子秒级计算,文谛资产是这样做到的...

以标题形式点明案例主题为复杂因子的秒级计算,并聚焦文谛资产的实践。

背景与客户介绍(文谛资产与使用 DolphinDB 的动机)

介绍量化投资数据处理背景、文谛资产定位与业务范围,以及选择 DolphinDB 作为时序数据研究工具的原因。

作者信息与写作目的

说明文章由文谛资产相关负责人共同撰写,分享使用场景、效果、服务与经验等内容。

合作概述:三年合作与服务形态

描述与 DolphinDB 的三年合作关系及其提供的数据库、分布式计算与编程建模一体化服务。

合作关系海报(图片及说明)

通过图片与说明强调文谛资产与 DolphinDB 的合作伙伴关系与选型定位。

使用场景

概述 DolphinDB 在文谛资产的三类主要应用:行情存储、因子挖掘与模型回测。

行情存储:入库、清洗与查询(分布式分区与 SQL 引擎)

描述在行情存储中使用 DolphinDB 的分区设计、SQL 引擎按分区过滤定位数据块、以及高效清洗时序数据的做法与效果。

因子挖掘:TB 级数据处理、Python API 与流计算/聚合引擎

说明因子挖掘中处理数据规模、使用内置多范式语言与计算引擎,并结合 Python API 与流计算框架、时间序列聚合引擎实现滑动窗口聚合计算。

模型回测:函数接口、元编程与计算框架(context by 等)

描述使用 DolphinDB 的函数接口与计算框架进行回测,并重点对比 context by 与 group by 的差异及其对回测研发效率的影响。

context by vs group by 对比图(图片及说明)

通过示意图与说明展示 context by 在分组计算中保留与原表一致数据条数的特性及其对研发效率的影响。

使用效果

从行情存储、因子挖掘、模型回测三个方面给出压缩比、计算耗时与回测效率等效果描述。

技术服务体验

描述 DolphinDB 技术支持服务的沟通、响应与需求实现速度,以及与 CEO 与团队交流的经历。

时序数据库选型:Kdb+ 与 DolphinDB 对比

说明选型中对比 Kdb+ 与 DolphinDB,并给出对两者在支持、语法学习成本、性能、引擎与函数库等方面的评价与最终选择。

学习和使用经验

给出上手时间建议与需要深入理解的内容,包括引擎、存储架构、分区表原理与函数学习,以及保持跟进版本迭代。

结尾:合作总结与展望

总结三年合作对量化投研的助力,并表达对双方未来发展的期望。

文末品牌联动封面图(图片及说明)

文末图片及说明再次强调双方合作与 DolphinDB 在复杂因子计算、行情存储与回测性能提升上的作用。

客户简介(行业与公司业务)

给出客户所属行业与公司简介,包括投资目标、服务对象与主要业务方向。

Facts Index

Entity Attribute Value Confidence
技能认证特训营第二期报名链接https://www.qingsuyun.com/h5/e/217471/5/high
上海文谛资产管理有限公司(文谛资产)公司定位/精神秉持理性、务实、高效、专业的投资精神medium
上海文谛资产管理有限公司(文谛资产)投资目标以创造长期稳定收益为投资目标high
上海文谛资产管理有限公司(文谛资产)服务对象为国内外投资者和合作机构提供专业的投资服务high
上海文谛资产管理有限公司(文谛资产)主要业务主要从事 CTA 和股票的量化策略研究与运作high
DolphinDB产品类型/定位(文中表述)高性能的分布式时序数据库high
文谛资产对 DolphinDB 的选择用途定位作为存储、计算和分析大量时间序列数据的强有力研究工具high
文谛资产与 DolphinDB 的合作合作时长三年(“在合作的三年间”)high
DolphinDB 为文谛资产提供的服务服务形态集数据库、分布式计算和编程建模于一体的专业服务high
本文作者(文中署名)共同撰写人员首席策略官刘一夫、首席框架官吴永华、首席数据分析师王哲high
文谛资产使用 DolphinDB 的场景主要应用方向行情存储、因子挖掘、模型回测high
行情存储场景用途数据入库、清洗与查询high
DolphinDB 分布式特性(在行情存储中使用)方法提前确定数据导入的分区字段与分区粒度以提高后续检索与分析效率high
DolphinDB SQL 引擎(在行情查询中)查询机制以分区字段为数据过滤,快速定位要查找的数据块,避免对整张表扫描,从而提高查询速度high
DolphinDB 数据清洗能力(行情存储)效果描述可对海量时序数据进行高效清洗,消除残缺、错误或重复数据并输出满足业务需求的高质量数据;数据量增大时能保持稳定性能(与其他工具相比)medium
文谛资产数据规模(因子挖掘)总数据量大概在几十 TBmedium
文谛资产数据规模(因子挖掘)每日新增数据量约为 70GBhigh
DolphinDB内置能力(文中表述)内置多范式编程语言与多种计算引擎high
DolphinDB 与 Python集成方式通过 Python API 将 DolphinDB 计算结果导入 Python 模型进行组合high
DolphinDB 流计算框架支持的能力(文中列举)流数据发布、订阅、预处理、实时内存计算以及复杂指标计算high
DolphinDB 时间序列聚合引擎用法与效果(文中表述)仅需设定几个参数指标,配合 wsum、corr 等聚合函数即可实现复杂的滑动时间窗口聚合计算high
模型回测场景使用的能力使用 DolphinDB 提供的函数接口、元编程和计算框架进行高效回测high
DolphinDB 函数(文中示例)示例函数context by、crossStathigh
context by(文中表述)独创性作为 DolphinDB 的独创功能可以实现对时序数据的快速分组medium
context by vs group by(文中对比)返回结果差异group by 每组只能返回一个标量值;context by 可以使每组返回一个与组内元素数量相同的向量high
context by vs group by(文中对比)可配合函数的差异(回测场景)group by 只能配合聚合函数使用;context by 可与其他聚合函数、移动窗口函数或累计函数等结合使用high
DolphinDB 元编程能力(文中表述)具备读取、生成、分析及转化其他程序的功能;通过动态表达式与延迟执行使研究人员在代码运行时仍可修改代码medium
MapReduce(文中提及的计算框架)用途帮助进行并发计算,提升计算效率medium
DolphinDB 压缩比例(行情存储效果)最高压缩比最高可以达到 10:1high
DolphinDB 行情存储效果(文中表述)研究人员感受压缩比率高、数据落库速度快(主观感受表述)low
复杂因子计算(因子挖掘效果)基于单日新增数据的计算耗时可以实现秒级计算medium
复杂因子测试(因子挖掘效果)使用大量历史数据的运算时间可控制在分钟级别medium
模型回测(回测效果)特定参数测试耗时整体时间可以控制在 1 分钟内medium
DolphinDB(模型回测效果归因)支持能力支持数据项目化的批量处理high
文谛资产与 DolphinDB 团队交流时间2020年与 DolphinDB CEO 周小华博士及技术团队当面深入交流high
DolphinDB CEO姓名与头衔(文中表述)周小华博士(DolphinDB CEO)high
DolphinDB 技术支持服务服务特点(文中表述)记录业务需求并在后续跟踪服务中逐一实现需求;技术咨询响应及时(包括周末/较晚时段);可提出开发需求medium
DolphinDB 需求实现速度(文中案例)版本交付曾沟通的一个特别功能需求很快在下一个版本中得到实现medium
Kdb+定位(文中表述)金融领域老牌时序数据库medium
Kdb+(与 DolphinDB 选型对比)被提及的不足国外厂商缺乏国内技术支持;语法晦涩;培训成本和学习成本较高medium
DolphinDB(与其他数据库对比的评价)查询与存储性能在查询和存储方面的性能明显优于其他数据库low
DolphinDB流计算引擎(文中表述)具备多种流计算引擎,对流数据处理友好medium
DolphinDB压缩比(选型理由)具有高压缩比medium
DolphinDB金融函数库(文中表述)内置丰富的金融函数库high
DolphinDB技术支持(选型理由)可以提供及时专业的技术支持medium
DolphinDB 学习门槛(文中表述)前置基础与上手时间有 Python 和 SQL 语法基础则一两周可以上手medium
DolphinDB 引擎使用的引擎类型(文中表述)使用 OLAP 和 TSDB 两种引擎high
DolphinDB 引擎能力(文中表述)写入吞吐可提供很高的写入吞吐medium
高效使用 DolphinDB 的建议需要深入理解的方面(文中建议)了解存储引擎架构与数据库设计原理(如分区表工作原理)以提升查询效率,并学习高效处理所需的函数medium
DolphinDB 版本迭代(文中表述)产品演进不断优化提升并扩展迭代新功能,建议保持学习并跟进版本技术动态low
客户行业行业私募high