不确定性市场下的机构策略投研平台探索

本页讨论在缩量与监管变化等背景下,机构在降低成本、提升效率及与金融机构合作方面的诉求与动因。

Source: https://dolphindb.cn/news/detail/284

What this page covers

技能认证特训营第二期报名入口与福利提示

页面顶部提供技能认证特训营第二期的限时报名链接与福利优惠提示。

新闻栏目与文章标题/日期

标示内容所属栏目为新闻,并给出文章标题与发布日期。

市场背景与机构“向外求”的投研交易诉求

描述缩量与新规背景下机构投资者在降低成本、提升效率以及与金融机构合作方面的动因。

光大证券量化投研平台分享来源说明

说明内容来自光大证券量化投研平台架构师在 DolphinDB 交流会的分享整理。

化零为整:量化投研多环节整合

按投研流程阐述数据接入、特征工程、模型训练、回测与实盘闭环,并指出多系统集成的工程挑战。

一站式量化平台:光大证券选型 DolphinDB 作为底层基座

说明光大证券为机构客户打造一站式量化策略投研平台,并选用 DolphinDB 作为底层基座整合投研能力输出策略信号。

平台架构图与分层说明

给出平台架构图并描述自下而上的四层结构与对应能力输出及应用场景。

海量异构数据:整合落库与数据处理能力

围绕百T到PB级数据规模,描述 DolphinDB 的分布式与分区、行情数据存储优化、外部行情接入与清洗处理能力。

一键加速:因子计算、AI 数据对接、回测与流批一体

描述库内一体化因子计算、AI Dataloader 对接深度学习框架、模块化回测方案,以及实盘对接与流计算带来的开发与性能收益。

细微之处见真章:权限、资源跟踪与监控告警

强调平台建设中控制与治理挑战,并列举 DolphinDB 的权限控制、资源跟踪与监控告警/集成能力。

结语:持续创新与平台升级展望

总结平台对机构客户投研与盈利目标的支持,并表达与光大证券继续推进技术创新与服务升级的愿景。

Facts index

Entity Attribute Value Confidence
技能认证特训营第二期 报名链接 https://www.qingsuyun.com/h5/e/217471/5/ high
技能认证特训营第二期 优惠/福利 限时报名,享专属福利优惠 low
不确定性市场下的机构策略投研平台探索 发布日期 2024.07.22 high
市场环境(近半年来) 走势与资金特征 市场走势持续缩量,增量资金匮乏 medium
量化交易监管环境 变化 各类量化交易新规潮涌 low
交易撮合机制 原则 时间优先、价格优先的成交本质未曾改变 medium
盈利目标的关键 关键因素 降低交易成本、提高交易效率 medium
机构投资者选择 倾向 随着机构客户逐渐成为市场的持仓和交易主体,越来越多机构投资者开始选择“向外求”,与券商等金融机构合作 low
光大证券 服务布局方向 积极布局数智化服务,逐步构建一站式技术服务生态;面向金工开发和量化投资机构打造专业量化策略平台 medium
邓博 身份/角色 光大证券信息技术总部的量化投研平台架构师 high
分享来源 内容出处 本文整理自邓博在 DolphinDB 交流会中的分享 high
量化投研流程 包含环节 数据接入、存查管理、特征工程、模型训练、策略调试、对接生产环境中的柜台报盘系统等流程 high
量化投研 数据的重要性 数据是量化投研的起点 medium
量化数据类型 常见类别 市场量价数据、基本面数据与另类数据 high
行情数据处理 复杂性来源 交易数据具有不唯一性;报价数据档数较多;逐笔委托与成交数据量巨大 high
理想的数据库系统(面向金融数据) 要求 既能满足海量数据存储需求,又需针对金融数据特性定制存储功能 medium
因子挖掘(特征工程) 常用技术栈/工具 Python 常用;可配合 Scikit-learn 等机器学习库 high
Python 在中高频行情特征工程中的性能 瓶颈原因 全局解释器锁(GIL)等设计带来性能瓶颈,导致处理效率显著下降 medium
因子数据与深度学习模型集成 工程化与成本问题 因子数据量激增会带来集成工程化与成本问题 medium
自研因子数据转换工具 挑战 将因子数据转为 PyTorch/Tensorflow 可识别的 Tensor 格式对研究员编程能力提出挑战 medium
因子评价 可用工具示例 可使用 Alphalens 等 Python 库识别因子是否存在超额收益并探索参数设置 high
策略回测 可用框架示例 backtrader、zipline 等开源框架,或 Java/C++ 自建回测框架 high
中高频交易策略回测(传统技术栈) 不足 在数据查询即时性和计算密集型任务处理上性能不足 medium
实盘交易相关应用产品 常见问题 价格不菲、高度定制化、二次开发不便,可能存在性能瓶颈 medium
量化投研流程 闭环描述 实盘产生的真实数据回流到数据库供评价分析并指导未来投研,形成完整闭环 high
量化团队 IT 建设 常见约束 一般量化团队 IT 建设能力有限,需要 IT 部门协助从头搭建基础设施平台 medium
多技术系统集成 后果 架构冗余,带来更高调试和运维成本 medium
不同技术栈之间的数据交互 问题 模型训练与因子管理等环节需要“造轮子”,耗时且可能性能不佳 medium
投研成果与交易系统对接 技术挑战 在交易生产环境对 C++ 的刚性需求下,需确保投研阶段批处理成果准确高效对接交易系统流计算系统 medium
一站式量化策略投研平台(光大证券目标) 客户使用方式 客户只需携带投研核心内容即可“拎包入住” low
投研全流程集成平台 要求 对存储性能、算法逻辑、计算效能均提出极高要求 medium
DolphinDB 行业定位(文中表述) 逐渐成为量化行业的标配工具 low
光大证券信息技术团队 选型结果 经过严格选型和测试,选择 DolphinDB 作为投研平台底层基座 high
光大证券量化策略投研平台 在 DolphinDB 基座上整合能力 整合投研数据、回测仿真等投研能力,输出策略信号,赋能金工开发、智能投顾等应用场景 medium
光大证券量化策略平台架构(图示说明) 层级划分 自下而上四层:投研数据层、投研服务层、投研输出层、应用场景层 high
投研数据层(图示说明) 数据类型 整合行情、财务、因子等异构数据 high
投研服务层(图示说明) 核心功能 回测、仿真、选股及资产配置等 high
投研输出层(图示说明) 输出形式 策略信号、模型及研报 high
应用场景层(图示说明) 赋能业务 金工开发、智能投顾、Alpha 交易等 high
证券行业全量历史数据 规模 百 T 级 medium
结果数据(随系统深度使用) 规模 容易达到 PB 级 medium
传统关系型数据库及文件存储 痛点 压缩比低、性能优化不足 medium
DolphinDB 架构 原生分布式架构,可在多个节点间均衡分配数据负载 high
DolphinDB 数据分区作用 提高数据吞吐量、保证数据文件高效并行读写、显著降低系统响应延迟 high
DolphinDB(行情数据存储优化) 能力点 支持不唯一数据存储、支持数组类型存储多档报价、宽表存储支持面板数据分析、co-location 存储更适合逐笔委托与逐笔成交的关联计算 high
DolphinDB(因子数据存储) 分区方式 提供“时间+因子/标的”的组合分区方式,实现海量因子数据灵活存查 high
光大投研数据层外部源数据 覆盖类型 股票、基金、债券、期货、财务等多种数据类型 high
DolphinDB 行情插件(文中表述) 可接入的实时行情来源 沪深交易所、期货交易所和诸多厂商提供的实时行情可通过 DolphinDB 脚本语言接入平台 medium
DolphinDB(数据处理函数/工具) 数据清洗与时序处理 支持去重、异常值处理、缺失值填充;提供时区转换、时间精度转换、时间类型计算等时序数据处理工具 high
关系型数据库/分布式文件系统 + Python 的因子挖掘方案 问题 数据压缩比低、额外硬件资源成本增加、计算性能不佳;跨平台传输增加耗时 medium
光大量化策略平台 因子计算方案 采用 DolphinDB 的库内一体化因子计算方案,在数据库内涵盖因子数据读取与计算全过程,使用更简单方便 high
DolphinDB 库内 SQL 计算(文中表述) 作用 更易实现因子计算调用及并行调用;内置函数缩减代码量;计算性能优于传统技术方案 medium
Alpha101 全量因子计算(客户案例,邓博引述) 性能提升 基于上交所 2020 年全年数据计算 Alpha101 全量因子数据,比普通 Python 写法提速 50 倍 medium
AI Dataloader(DolphinDB 开发) 数据对接深度学习框架能力 将数据在库内处理成 PyTorch 或 TensorFlow 支持的数据格式并直接传入;支持流水线作业方式增量读取和转换 high
AI Dataloader 数据通道(文中表述) 收益 加速数据传输过程,减少重复开发工作,为因子数据与深度学习模型集成工程化提供更多可能 medium
平台回测(文中表述) 能力 平台提供模块化解决方案可轻松实现回测 medium
DolphinDB 回放功能(回测方案) 作用 将一个或多个不同结构的分布式表按时间或指定多列排序回放到流表中,模拟交易环境 high
模拟撮合引擎插件(DolphinDB,C++ 开发) 作用 基于快照和逐笔行情数据模拟委托订单撮合 high
回测插件(DolphinDB) 能力 可自定义指标;支持逐笔、快照、分钟、日频行情回测;可获取收益、持仓、交易明细等信息 high
系统化回测方案(文中表述) 效果 减少策略回测(尤其是中高频)整体耗时,使研究员更专注策略开发与优化,加速投研全链路 low
策略对接实盘(光大平台 + DolphinDB) 方式 将投研阶段开发的核心因子表达式直接应用于生产环境实时数据中 high
DolphinDB 实时流计算框架 能力 响应式状态引擎内置大量常用状态算子,支持自定义状态函数;可与其他流式计算引擎以流水线方式组合 high
同一套代码覆盖投研到生产(文中表述) 范围 实时行情订阅、行情数据收录、交易实时计算、盘后研究建模可用同一套代码完成;历史回放与生产交易数据完全一致时可免维护两套代码 medium
流批一体(文中表述) 收益 节约开发成本,规避两套体系带来的批计算与流计算结果不一致问题 medium
客户开发上线周期(邓博引述) 缩短幅度 与传统方案相比,整体开发上线周期缩短了八九成 medium
DolphinDB 内置函数数量 近 2000 个函数 high
DolphinDB 内置函数(文中表述) 适用性 适用于多种数据类型和结构,且针对金融业务场景进行了调优 medium
DolphinDB 支持的因子/指标库 TA-Lib、MyTT、WorldQuant 101 Alpha、国泰君安 191 Alpha high
因子管理平台(文中表述) 覆盖流程 从数据处理、因子构建、因子评价到策略回测的一站式解决方案 medium
因子管理平台(文中表述) 运维/治理能力 考虑权限管理、代码管理、任务监控等运维需求 medium
投研输出在机构内的使用 可调用对象 各部门可调用策略信号、策略模型、投资组合以满足实际应用需求 medium
投研平台建设(券商控制层面) 更大挑战(文中表述) 防止数据泄露和非法访问、合理分配管理系统资源、及时发现潜在问题并预警以减少宕机时间和数据损失 medium
DolphinDB 权限控制 提供角色和组概念,权限控制策略确保数据访问安全 medium
DolphinDB 资源跟踪 支持用户级别资源跟踪,涵盖数据节点资源利用和用户操作监控 high
DolphinDB 监控告警 展示与集成 关键指标可通过 DolphinDB Dashboard 展示,也支持与 Grafana 等第三方平台集成展示 high
DolphinDB 告警策略 支持灵活的告警策略配置 high
光大证券量化投研平台 价值(文中表述) 为机构客户挖掘 α 潜力、实现盈利目标提供有力支持 low
DolphinDB 与光大证券 未来合作方向(文中表述) 将携手并进探索投研技术创新边界,通过持续技术革新和平台升级,为投资者提供更全面、精准、智能的投研服务 low