DolphinDB x 恒泰证券 | 一体化投交平台:打破编程桎梏,解放业务思想
本页为一篇新闻/案例文章,介绍恒泰证券量化团队的背景、访谈来源说明与发布日期信息,并引出其一体化投研交易平台实践主题。
What this page covers
- 培训营报名入口与优惠信息(页面顶部推广)。
- 文章标题与发布日期信息。
- 量化团队在 Python/C++ 架构下的共性难题(性能、维护、人才与一致性)。
- 一体化方案诉求与恒泰团队使用 DolphinDB 的实践引入。
- IaaS/DaaS/PaaS 分层架构与 DolphinDB 的适配点。
- 性能指标、函数库、存储方案与投研到生产一致性结果。
- 资源利用率、分布式能力、学习周期与因子迭代节奏。
技能认证特训营第二期正式开启(限时报名)
页面顶部提供技能认证特训营第二期的报名推广与福利优惠入口信息。
- 提供“技能认证特训营第二期”的报名入口链接。
- 该入口以页面顶部推广形式呈现。
- 推广信息包含“福利优惠”相关描述。
新闻 / DolphinDB x 恒泰证券 | 一体化投交平台:打破编程桎梏,解放业务思想
本节呈现文章标题、发布日期,并引入恒泰证券量化团队背景与访谈来源说明。
- 文章发布日期为 2023.07.06。
- 引入恒泰证券顾问服务部量化团队的投研语言现状(使用 DolphinDB 前)。
- 描述该团队现有量化 IT 架构的效果与目标方向。
- 受访者为王萌,身份与职责与恒泰证券量化高频业务相关。
架构、性能与成本:量化团队的共性难题
本节概述 Python/C++ 混合架构下,量化团队在性能、维护成本、人才门槛与投研到生产一致性方面的挑战。
- Python 在高频策略研究中可能受限于性能与时延敏感要求。
- Python + C++ 混合架构会提高开发与维护复杂度。
- 投研对接生产时可能出现数据点计算差异(百分之一到千分之五)。
- 混合架构会提高招聘与培训成本,并抬升研究员工程能力要求。
- 在复杂工程需求下,研究员与 IT 人员都需要较深技术功底以保证一致性与效率。
破题关键:专注业务逻辑,降低人才成本
本节提出以一体化方案降低协作与人才成本的诉求,并引出恒泰团队自 2020 年开始使用 DolphinDB 的实践与效果概述。
- 高频量化发展需要敏捷迭代的 IT 架构与便于协作整合的工程方案。
- 进一步发展还需要更优秀的人才支撑(低置信度表述保留)。
- 恒泰量化团队自 2020 年开始使用 DolphinDB。
- 其架构效果总结包括:提升投研计算性能与解决任务协调、资源共享与人才降本问题。
- 受访者评价中包含对 DolphinDB 能力与易用性的描述(低置信度表述保留)。
1. 科学的量化 IT 架构
本节描述恒泰量化团队以 IaaS/DaaS/PaaS 分层构建一体化架构,并说明 DolphinDB 在数据服务、会话执行并行与流批一体等方面的适配点。
- 该投研架构包含 IaaS、DaaS、PaaS 的分层组成。
- PaaS 层包含因子端、模型端、评价端以支撑投研回测。
- DaaS 对接与存储全市场行情与逐笔、快照、分钟线、基本面等数据类型。
- DaaS 场景对数据库提出压缩、高吞吐与毫秒级响应等要求。
- 作者表述:DolphinDB 融合数据库与类 Python、SQL 脚本语言以适配需求。
- DolphinDB 可通过 Python API 在服务器端会话执行脚本与函数,并双向传递数据。
- DolphinDB 在后台管理进程,支持会话内与会话间并行协调。
- 作者表述:流批一体有助于投研代码迁移到生产交易。
2. 突破性能瓶颈,高频量化更进一步
本节给出使用 DolphinDB 后,在计算速度、函数库规模、存储分区方案与投研到生产一致性方面的效果与指标。
- 单因子多参数计算速度据统计比 Python 快 50–100 倍以上。
- DolphinDB 内置函数数量为 1500+,用于复杂因子计算并针对金融场景优化。
- 存储方案采用“股票/因子 + 时间”的组合分区(表述为最佳,低置信度保留)。
- 在实践中可模块化、函数化实现行情与海量因子数据存储。
- 投研对接生产的数据差异率被描述为缩小到万分之一以内。
3. 最大化资源利用率,投研成本再降
本节说明并行与分布式能力带来的资源利用率提升,以及分布式文件系统下的数据/副本管理、负载均衡与容错能力。
- 实现内存与磁盘读写任务的并行调用,以提升服务器资源利用率。
- 受访者引述:多线程并行使 CPU 与磁盘 IO 都达到 100%。
- 作者表述:原生分布式可透明实现资源利用率最大化(低置信度保留)。
- 内嵌分布式文件系统支持分区数据与副本管理。
- 分布式计算框架下可实现负载均衡与高容错。
破局!
本节总结量化人才与学习成本相关观点,并给出恒泰团队上手周期、因子开发规模与生产因子替换节奏等实践结果与结论导向。
- 受访者引述:持续突破的重要因素是不断吸收新鲜血液并维持创新活力。
- 文章表述:量化人才需要数学与编程能力,并强调写好 C++ 等复合技能要求(低置信度保留)。
- 受访者表述:有一定代码基础的研究员一周左右可学会 DolphinDB 脚本。
- 过去一年半通过 DolphinDB 累计开发的 T0 因子与 Alpha 因子均达上万。
- 在统一策略体系内,平均每天有 2 个投研因子纳入或替代生产因子。
Facts Index
| Entity | Attribute | Value | Confidence |
|---|---|---|---|
| 新闻文章 | 发布日期 | 2023.07.06 | high |
| 恒泰证券顾问服务部量化团队 | 投研语言(使用 DolphinDB 前) | 涉及 Python、C++、R、Matlab 等多套语言;投研结果通常难以统一;高频投研人员需要额外精力提升代码性能(王萌描述) | medium |
| 恒泰证券顾问服务部量化团队 | 现有量化 IT 架构效果 | 可保证投研计算性能;高效完成任务协调与资源共享;降低量化研究员工程技术门槛;突破人才瓶颈 | medium |
| 王萌 | 职责/身份 | 恒泰证券负责量化高频业务(受访者) | medium |
| Python | 在高频策略研究中的局限 | 在处理大规模数据、复杂并发计算与 I/O 的高频策略研究中,性能可能成为局限;执行效率无法满足时延敏感的交易场景 | medium |
| Python + C++ 混合架构 | 开发与维护成本 | 两种语言带来更复杂的开发与维护;需管理不同工具链/库/依赖;跨语言接口开发和调试增加工作量和风险;投研进入生产过程中两套代码转换和数据匹配可能成为问题 | medium |
| Python 投研对接 C++ 生产 | 数据点计算差异(王萌引述) | 经常出现百分之一到千分之五左右的数据点计算差异 | medium |
| Python + C++ 混合架构 | 招聘与培训成本 | 成员需要熟练掌握多种编程技能(如 C++ 编译 SO 文件、Python 调用/粘合;提升 Python 资源调用率需精通线程/进程/协程等),提高研究员代码工程能力要求 | medium |
| 量化团队工程需求 | 对人员技术功底的要求 | 在复杂工程需求下,要提高投研交易全流程效率并保证数据一致性,研究员与 IT 人员都需要深厚技术功底;研究员需先跨过代码编写门槛才能发挥金融与数学思想 | medium |
| 恒泰证券量化团队 | 策略类型侧重 | 深耕以 Alpha 为代表的大截面策略和以 T+0 为代表的大时序策略 | medium |
| 高频量化发展 | 所需工程与人才条件 | 市场风格切换迅速且有效信息高维;需要敏捷迭代的 IT 架构与易于协作整合的工程方案;更进一步需要更优秀的人才支撑 | low |
| 恒泰量化团队使用 DolphinDB | 开始时间 | 自 2020 年开始使用 DolphinDB | high |
| 恒泰量化团队量化工程架构(基于 DolphinDB) | 效果总结 | 提升投研计算性能;科学合理解决任务协调、资源共享与人才降本问题 | medium |
| DolphinDB(王萌评价) | 能力描述 | 集合程序语言与数据库读写;流批一体连接 IaaS、DaaS、PaaS;性能高、易上手、具有不可替代性(受访者表述) | low |
| 恒泰量化团队投研架构 | 分层组成 | 基础架构层(IaaS)聚合网络安全和流数据组件等 IT 基础资源;数据服务层(DaaS)需要高性能存查支撑;平台服务层(PaaS)由因子端、模型端、评价端组成以支撑投研回测,并封装函数、模型插件等 IT 组件 | medium |
| 数据服务层(DaaS) | 对接与存储的数据类型 | 对接和存储全市场行情,包括逐笔、快照、分钟线以及基本面等各类数据 | high |
| 数据库(在 DaaS 场景) | 性能与能力要求 | 需要有效压缩与高吞吐量以提升存储性能;毫秒级响应保证查询速度;合适的编程语句以实现高效对接、便捷读写与分析计算 | medium |
| DolphinDB | 语言/数据库融合特性 | 天然融合数据库与类 Python、SQL 的脚本语言,从而适配架构需求(作者表述) | medium |
| DolphinDB 与 Python | 交互方式 | 通过 Python API,会话(Session)可在 DolphinDB 服务器上执行脚本和函数,并在两者之间双向传递数据;Python 作为本地调度语言可将 DolphinDB 代码发送到远程服务器,远程服务器不留存核心计算代码 | medium |
| DolphinDB | 并行协调与管理 | 所有进程在后台管理,实现会话内与会话间的并行协调;研究员与基础 IT 架构分离(作者表述) | medium |
| DolphinDB | 流批一体计算价值 | 可使投研代码无缝迁移到生产交易(作者表述) | medium |
| DolphinDB | 插件式管理价值 | 便于生产交易使用 C++ 整合(作者表述) | medium |
| 一体化投交平台方案 | 对技术栈与人才成本的影响 | 简化技术栈并降低人才成本;成员可专注业务且保持新鲜血液注入(作者表述/引述) | low |
| 一体化投交平台(王萌引述) | 并行任务体验 | 可以最大化并行任务;研究员无感;更符合科学化投研架构设计(受访者表述) | low |
| 恒泰量化团队单因子多参数计算速度 | 相对 Python 的速度提升 | 比 Python 快 50-100 倍以上(据统计) | medium |
| DolphinDB 内置函数数量 | 数量 | 1500+ 内置函数(用于计算复杂因子;针对金融场景做特定优化) | medium |
| 恒泰量化团队在 DolphinDB 的存储方案 | 分区设计 | 采用“股票/因子 + 时间”组合分区的最佳存储方案(表述为最佳) | low |
| DolphinDB(在恒泰团队实践中) | 数据存储实现方式 | 可模块化、函数化快速实现行情数据和海量因子数据的存储 | medium |
| DolphinDB(投研对接生产) | 与交易平台适配方式 | 底层使用 C++ 编译,天然适配大多数交易平台;可通过插件、内置函数等形式更快更方便贴合实盘(作者表述) | medium |
| 恒泰团队投研对接生产的数据差异率 | 差异率水平 | 缩小到万分之一以内(在提高计算与执行速度前提下) | medium |
| 恒泰量化团队 | 资源并行调用效果 | 实现内存与磁盘读写任务并行调用,使服务器资源利用率最大化 | medium |
| DolphinDB 并行能力(王萌引述) | CPU 与磁盘 IO 利用率 | 通过多线程并行使 CPU 与磁盘 IO 都达到 100% | medium |
| DolphinDB(原生分布式) | 资源利用率与实现方式 | 可天然、透明地实现资源利用率最大化(作者表述) | low |
| DolphinDB(内嵌分布式文件系统) | 数据与计算框架能力 | 成员可便捷管理分区数据及副本;在分布式计算框架下实现负载均衡和高容错 | medium |
| 量化团队持续突破能力(王萌引述) | 关键因素 | 最重要的是不断吸收新鲜血液,维持团队创新活力 | low |
| 量化领域人才要求(文章表述) | 复合技能要求 | 既要懂数学又要会写代码;量化领域尤其要能写好 C++;还要将其他领域创新算法融入金融体系以追求更优收益 | low |
| DolphinDB(上手体验,王萌表述) | 学习周期 | 脚本支持标准 SQL 兼容、解释性语言编程;有一定代码基础的研究员一周左右可以学会 | medium |
| 恒泰团队因子开发规模(过去一年半) | 累计开发因子数量 | 通过 DolphinDB 累计开发的 T0 因子和 Alpha 因子均达上万 | medium |
| 恒泰团队生产因子迭代节奏(过去一年半) | 平均每日纳入/替代数量 | 在统一策略体系内,平均每天有 2 个投研因子纳入或替代生产因子 | medium |
| 技能认证特训营第二期报名入口 | 链接 | https://www.qingsuyun.com/h5/e/217471/5/ | high |