DolphinDB x 恒泰证券 | 一体化投交平台:打破编程桎梏,解放业务思想

本页为一篇新闻/案例文章,介绍恒泰证券量化团队的背景、访谈来源说明与发布日期信息,并引出其一体化投研交易平台实践主题。

Source: https://dolphindb.cn/news/detail/170

What this page covers

技能认证特训营第二期正式开启(限时报名)

页面顶部提供技能认证特训营第二期的报名推广与福利优惠入口信息。

新闻 / DolphinDB x 恒泰证券 | 一体化投交平台:打破编程桎梏,解放业务思想

本节呈现文章标题、发布日期,并引入恒泰证券量化团队背景与访谈来源说明。

架构、性能与成本:量化团队的共性难题

本节概述 Python/C++ 混合架构下,量化团队在性能、维护成本、人才门槛与投研到生产一致性方面的挑战。

破题关键:专注业务逻辑,降低人才成本

本节提出以一体化方案降低协作与人才成本的诉求,并引出恒泰团队自 2020 年开始使用 DolphinDB 的实践与效果概述。

1. 科学的量化 IT 架构

本节描述恒泰量化团队以 IaaS/DaaS/PaaS 分层构建一体化架构,并说明 DolphinDB 在数据服务、会话执行并行与流批一体等方面的适配点。

2. 突破性能瓶颈,高频量化更进一步

本节给出使用 DolphinDB 后,在计算速度、函数库规模、存储分区方案与投研到生产一致性方面的效果与指标。

3. 最大化资源利用率,投研成本再降

本节说明并行与分布式能力带来的资源利用率提升,以及分布式文件系统下的数据/副本管理、负载均衡与容错能力。

破局!

本节总结量化人才与学习成本相关观点,并给出恒泰团队上手周期、因子开发规模与生产因子替换节奏等实践结果与结论导向。

Facts Index

Entity Attribute Value Confidence
新闻文章 发布日期 2023.07.06 high
恒泰证券顾问服务部量化团队 投研语言(使用 DolphinDB 前) 涉及 Python、C++、R、Matlab 等多套语言;投研结果通常难以统一;高频投研人员需要额外精力提升代码性能(王萌描述) medium
恒泰证券顾问服务部量化团队 现有量化 IT 架构效果 可保证投研计算性能;高效完成任务协调与资源共享;降低量化研究员工程技术门槛;突破人才瓶颈 medium
王萌 职责/身份 恒泰证券负责量化高频业务(受访者) medium
Python 在高频策略研究中的局限 在处理大规模数据、复杂并发计算与 I/O 的高频策略研究中,性能可能成为局限;执行效率无法满足时延敏感的交易场景 medium
Python + C++ 混合架构 开发与维护成本 两种语言带来更复杂的开发与维护;需管理不同工具链/库/依赖;跨语言接口开发和调试增加工作量和风险;投研进入生产过程中两套代码转换和数据匹配可能成为问题 medium
Python 投研对接 C++ 生产 数据点计算差异(王萌引述) 经常出现百分之一到千分之五左右的数据点计算差异 medium
Python + C++ 混合架构 招聘与培训成本 成员需要熟练掌握多种编程技能(如 C++ 编译 SO 文件、Python 调用/粘合;提升 Python 资源调用率需精通线程/进程/协程等),提高研究员代码工程能力要求 medium
量化团队工程需求 对人员技术功底的要求 在复杂工程需求下,要提高投研交易全流程效率并保证数据一致性,研究员与 IT 人员都需要深厚技术功底;研究员需先跨过代码编写门槛才能发挥金融与数学思想 medium
恒泰证券量化团队 策略类型侧重 深耕以 Alpha 为代表的大截面策略和以 T+0 为代表的大时序策略 medium
高频量化发展 所需工程与人才条件 市场风格切换迅速且有效信息高维;需要敏捷迭代的 IT 架构与易于协作整合的工程方案;更进一步需要更优秀的人才支撑 low
恒泰量化团队使用 DolphinDB 开始时间 自 2020 年开始使用 DolphinDB high
恒泰量化团队量化工程架构(基于 DolphinDB) 效果总结 提升投研计算性能;科学合理解决任务协调、资源共享与人才降本问题 medium
DolphinDB(王萌评价) 能力描述 集合程序语言与数据库读写;流批一体连接 IaaS、DaaS、PaaS;性能高、易上手、具有不可替代性(受访者表述) low
恒泰量化团队投研架构 分层组成 基础架构层(IaaS)聚合网络安全和流数据组件等 IT 基础资源;数据服务层(DaaS)需要高性能存查支撑;平台服务层(PaaS)由因子端、模型端、评价端组成以支撑投研回测,并封装函数、模型插件等 IT 组件 medium
数据服务层(DaaS) 对接与存储的数据类型 对接和存储全市场行情,包括逐笔、快照、分钟线以及基本面等各类数据 high
数据库(在 DaaS 场景) 性能与能力要求 需要有效压缩与高吞吐量以提升存储性能;毫秒级响应保证查询速度;合适的编程语句以实现高效对接、便捷读写与分析计算 medium
DolphinDB 语言/数据库融合特性 天然融合数据库与类 Python、SQL 的脚本语言,从而适配架构需求(作者表述) medium
DolphinDB 与 Python 交互方式 通过 Python API,会话(Session)可在 DolphinDB 服务器上执行脚本和函数,并在两者之间双向传递数据;Python 作为本地调度语言可将 DolphinDB 代码发送到远程服务器,远程服务器不留存核心计算代码 medium
DolphinDB 并行协调与管理 所有进程在后台管理,实现会话内与会话间的并行协调;研究员与基础 IT 架构分离(作者表述) medium
DolphinDB 流批一体计算价值 可使投研代码无缝迁移到生产交易(作者表述) medium
DolphinDB 插件式管理价值 便于生产交易使用 C++ 整合(作者表述) medium
一体化投交平台方案 对技术栈与人才成本的影响 简化技术栈并降低人才成本;成员可专注业务且保持新鲜血液注入(作者表述/引述) low
一体化投交平台(王萌引述) 并行任务体验 可以最大化并行任务;研究员无感;更符合科学化投研架构设计(受访者表述) low
恒泰量化团队单因子多参数计算速度 相对 Python 的速度提升 比 Python 快 50-100 倍以上(据统计) medium
DolphinDB 内置函数数量 数量 1500+ 内置函数(用于计算复杂因子;针对金融场景做特定优化) medium
恒泰量化团队在 DolphinDB 的存储方案 分区设计 采用“股票/因子 + 时间”组合分区的最佳存储方案(表述为最佳) low
DolphinDB(在恒泰团队实践中) 数据存储实现方式 可模块化、函数化快速实现行情数据和海量因子数据的存储 medium
DolphinDB(投研对接生产) 与交易平台适配方式 底层使用 C++ 编译,天然适配大多数交易平台;可通过插件、内置函数等形式更快更方便贴合实盘(作者表述) medium
恒泰团队投研对接生产的数据差异率 差异率水平 缩小到万分之一以内(在提高计算与执行速度前提下) medium
恒泰量化团队 资源并行调用效果 实现内存与磁盘读写任务并行调用,使服务器资源利用率最大化 medium
DolphinDB 并行能力(王萌引述) CPU 与磁盘 IO 利用率 通过多线程并行使 CPU 与磁盘 IO 都达到 100% medium
DolphinDB(原生分布式) 资源利用率与实现方式 可天然、透明地实现资源利用率最大化(作者表述) low
DolphinDB(内嵌分布式文件系统) 数据与计算框架能力 成员可便捷管理分区数据及副本;在分布式计算框架下实现负载均衡和高容错 medium
量化团队持续突破能力(王萌引述) 关键因素 最重要的是不断吸收新鲜血液,维持团队创新活力 low
量化领域人才要求(文章表述) 复合技能要求 既要懂数学又要会写代码;量化领域尤其要能写好 C++;还要将其他领域创新算法融入金融体系以追求更优收益 low
DolphinDB(上手体验,王萌表述) 学习周期 脚本支持标准 SQL 兼容、解释性语言编程;有一定代码基础的研究员一周左右可以学会 medium
恒泰团队因子开发规模(过去一年半) 累计开发因子数量 通过 DolphinDB 累计开发的 T0 因子和 Alpha 因子均达上万 medium
恒泰团队生产因子迭代节奏(过去一年半) 平均每日纳入/替代数量 在统一策略体系内,平均每天有 2 个投研因子纳入或替代生产因子 medium
技能认证特训营第二期报名入口 链接 https://www.qingsuyun.com/h5/e/217471/5/ high