自营投研 - 股票
页面通过主题引导图与说明引出券商自营投研(股票)场景背景,并指向后续能力内容方向。
Source: https://dolphindb.cn/solution/detail/brokerage_equity-proprietary-investment
What this page covers
- 因子存储(集中因子库、多频、多资产、写入/查询与实测表现)。
- 因子计算(语言、向量化与流计算、复用封装、指标模块与资料链接)。
- 流批一体因子开发(投研到生产衔接、一致性、回填与实时更新)。
- 多因子建模(特征/标签生成、传统模型、风险模型、机器学习/深度学习)。
- 因子自动挖掘(Shark GPLearn 框架、试用入口、教程与白皮书)。
- 因子管理平台(全生命周期管理、元数据、指标对比协作与入口)。
- 回测与模拟撮合(事件驱动流程、撮合规则、参数配置与资料链接)。
技能认证特训营第二期活动入口
页面顶部提供活动宣传信息与限时报名链接入口。
- 提供“技能认证特训营第二期”的限时报名链接。
- 报名链接指向独立页面地址。
券商自营投研(股票)主题引导图
通过主题图片与说明引出“驱动自营业务精细化运营”的场景背景与后续内容方向。
- 主题图核心表述为“驱动自营业务精细化运营”。
- 该引导用于承接后续投研能力模块介绍。
自营投研 - 股票
作为主体标题,对券商股票自营投研场景下的能力介绍进行总览定位。
- 页面主体围绕“自营投研 - 股票”场景展开。
- 内容组织聚焦因子与投研生产全流程相关能力。
因子存储
介绍将多团队因子统一沉淀为集中因子库,并支持多频、多资产、分区与高性能写入/查询及实测表现。
- 支持将分散因子结果统一沉淀为集中因子库。
- 支持在同一架构管理毫秒级到月度等多频因子。
- 因子库覆盖股票、期货、期权等多资产。
- 支持按时间×标的或时间×因子名等维度灵活分区。
- 支持在库内直接完成因子写入、更新与查询。
- 实测描述包含分钟级批量入库数百GB多因子数据。
- 实测描述包含秒级完成单因子全市场增删改。
- 提供“中高频多因子库存储最佳实践”的教程链接。
因子计算
介绍内置编程语言、向量化函数与流计算引擎,以及可复用封装与多种因子指标模块支持。
- 内置图灵完备的编程语言用于因子计算。
- 结合丰富的向量化函数与流计算引擎。
- 支持表达截面、时序、行业/主题与跨资产因子逻辑。
- 支持通过 UDF 与模块封装自研逻辑,实现组内复用与机构共享。
- 提供多个内置指标库模块链接(如 WQ101Alpha、TA、MyTT、CSAP)。
- 提供因子计算最佳实践与多个因子实现案例链接集合。
流批一体因子开发
阐述流批一体架构实现因子从投研到生产无缝衔接、回测与实盘一致性、回填与实时更新及效率提升。
- 投研基于历史数据开发的逻辑可直接部署到实盘流式计算环境。
- 该架构主张“确保回测与实盘的因子值完全一致”。
- 开发模式描述为“一次开发、处处运行”。
- 描述消除传统 Python 研发 + C++ 生产的双栈开发困扰。
- 策略上线周期缩短幅度描述为“80% 以上”。
- 支持因子历史批量回填与实时增量更新。
- 从因子创意到实盘验证闭环耗时描述为“数小时内”。
- 提供流批一体因子平台搭建与实时高频因子等教程链接。
多因子建模
基于分布式 JOIN 与时序计算对齐多源数据生成特征与标签,并支持传统多因子模型、风险模型与机器学习/深度学习建模与推理。
- 依托高性能分布式 JOIN 与时序计算引擎。
- 将因子与行情、财务、持仓、交易及风险因子按时间与标的对齐。
- 对齐后可一步生成建模所需特征表与标签集。
- 支持线性加权、截面回归、IC 加权等传统多因子模型。
- 模型输出可用于生成标的打分或预期收益,用于选股和择时。
- 提供多因子风险模型框架,用于暴露分析、收益归因与组合优化。
- 提供机器学习框架与插件/工具支持(如 XGBoost、AI Dataloader、LibTorch)。
- 建模流程主张可在 DolphinDB 内完成训练与实时推理。
- 提供波动率预测等机器学习与深度学习示例教程链接。
因子自动挖掘
介绍基于统一数据底座的自动挖掘能力与 Shark GPLearn 框架特性,并提供试用入口与教程白皮书链接。
- 面向已构建大规模因子库的机构提供因子自动挖掘能力。
- 支持从海量历史数据中自动搜索潜在 Alpha。
- Shark GPLearn 为基于遗传算法的因子自动挖掘框架。
- 通过符号回归自动生成与数据分布相拟合的 Alpha 表达式。
- 相对开源 gplearn,提供 GPU 加速与算子库整合。
- 原生支持“时间 × 股票 × 因子”的三维面板数据处理。
- 效果主张包含缩短“生成-筛选-回测”迭代周期与提升产出效率。
- 提供 Shark GPLearn 试用入口链接。
- 提供快速上手教程与白皮书链接。
因子管理平台
介绍覆盖因子全生命周期的一体化管理平台能力、元数据记录与指标对比协作,并提供试用入口与资料链接。
- 定位为覆盖因子全生命周期的一体化管理平台。
- 贯穿数据管理、因子研究、因子评估、策略回测的投研流程。
- 自动记录因子计算逻辑、数据依赖、历史表现与应用策略等元数据。
- 支持因子血缘追溯与影响分析。
- 支持查看 IC、IC_IR、多空收益等指标并对比优化组合。
- 多用户协作机制用于共享成果并减少重复开发。
- 提供因子管理平台(Starfish)试用入口链接。
- 提供快速上手资料与白皮书链接。
中高频回测框架
说明回测框架的事件驱动工作流、风控与撮合流程、覆盖资产品种与相对其他工具的性能与实现方式。
- 框架集数据回放、模拟撮合引擎与回测引擎于一体。
- 事件驱动引擎将历史数据流分发到撮合引擎与策略回调函数。
- 回测引擎执行风控校验(资金、持仓、涨跌停等约束)。
- 通过校验的订单进入模拟撮合并实时更新账户状态。
- 覆盖资产品种描述包含股票、期权、期货、银行间债券与数字货币。
- 对比对象包括 Backtrader 与 MetaTrader4。
- 核心撮合与回测引擎采用 C++ 实现。
- 性能描述为在相关规模下相较 Python 框架可实现最高数十倍提升。
- 提供回测快速上手与性能优化攻略链接。
模拟撮合
描述模拟撮合引擎插件的输入、撮合规则、参数配置、算法类型与回测收益可实现性校正用途。
- 插件用于精确仿真订单在真实市场中的成交过程。
- 接收实时行情数据(快照或逐笔)与策略委托订单。
- 委托类型包含限价、市价与撤单。
- 按价格优先、时间优先构建虚拟订单簿并动态计算成交结果。
- 支持配置通道延迟、成交比例等参数。
- 逐笔行情可实时合成 Tick 级订单簿并持续撮合。
- 快照行情可配置未成交订单是否跨快照排队等待。
- 撮合算法示例包括按比例撮合与基于区间成交明细的仿真方法。
- 用途描述为校正理想回测收益为更贴近实盘的可实现收益。
- 用于评估滑点、流动性约束与冲击成本影响。
- 提供模拟撮合引擎使用教程链接。
原生 Python 和 C++ 嵌入式方案
介绍 Swordfish 嵌入式方案在 Python/C++ 应用进程内调用 DolphinDB 引擎以提升性能并降低迁移成本的定位。
- 支持在 Python 与 C++ 应用程序中直接调用 DolphinDB 计算引擎。
- 无需通过网络连接数据库即可调用引擎能力。
- 目标团队描述为券商自营投研团队。
- 已有 Python 脚本与 C++ 程序可在不改写核心逻辑前提下获得相关能力。
- 数据处理时延级别主张包含“毫秒级”。
- 提供 C++ Swordfish 方案教程链接。
AI 智能投研
介绍将大语言模型与量化研究融合的 AI 投研系统能力与若干 Agent 功能,并描述其对术语理解与脚本生成的支持。
- 定位为将大语言模型与量化研究深度融合的智能投研系统。
- 投研人员可通过自然语言完成复杂分析任务(定位描述)。
- 研报因子复现 Agent:输入研报 PDF 识别因子逻辑并生成可执行代码。
- 因子迭代 Agent:基于历史表现推荐调参方向与因子组合方案。
- 组合管理 Agent:支持自然语言查询收益、归因与行业暴露并生成报表。
- 智能选股 Agent:生成股票池并给出选股理由(能力描述)。
- 术语理解主张包含“市值中性化”“行业轮动”“动量反转”等。
- 描述可自动生成 DolphinDB 计算脚本并返回结果。
- 适用人群描述包含降低非技术研究员的量化分析门槛。
- 也被描述为为资深量化团队提供辅助工具以加速迭代。
Facts Index
| Entity | Attribute | Value | Confidence |
|---|---|---|---|
| 技能认证特训营第二期 | 限时报名链接 | https://www.qingsuyun.com/h5/e/217471/5/ | high |
| 券商股票自营投研主题 | 主题图核心文字 | 驱动自营业务精细化运营 | medium |
| DolphinDB 因子存储 | 集中沉淀方式 | 支持将分散在各研究团队、各策略组的因子结果统一沉淀为集中因子库 | high |
| DolphinDB 因子库管理 | 支持的因子频率范围 | 同一套架构下管理从毫秒级高频因子到日度、周度、月度因子 | high |
| DolphinDB 因子库 | 覆盖资产类型 | 覆盖股票、期货、期权等多资产 | high |
| DolphinDB 因子库 | 分区维度示例 | 可按「时间 × 标的」或「时间 × 因子名」等维度灵活分区 | high |
| DolphinDB 因子库 | 库内操作能力 | 在库内直接完成因子写入、更新与查询 | high |
| 因子存储实测场景 | 批量入库耗时与数据规模 | 分钟级完成数百 GB 多因子数据的批量入库 | medium |
| 因子存储实测场景 | 单因子全市场增删改耗时 | 秒级完成单因子全市场增删改 | medium |
| 因子存储资料 | 教程链接 | 中高频多因子库存储最佳实践:https://docs.dolphindb.cn/zh/tutorials/best_practices_for_multi_factor.html | high |
| DolphinDB 因子计算 | 语言能力 | 内置图灵完备的编程语言 | high |
| DolphinDB 因子计算 | 计算能力组成 | 结合丰富的向量化函数与流计算引擎 | high |
| DolphinDB 因子计算 | 可表达的因子类型 | 可高效表达截面因子、时序因子、行业/主题因子以及跨资产因子逻辑 | medium |
| DolphinDB 因子体系 | 多周期融合能力 | 高频微结构因子、日度技术与风格因子、中长期基本面因子可在同一框架下融合,构建多周期协同的 Alpha 体系 | medium |
| DolphinDB 因子逻辑复用 | 封装方式与复用范围 | 通过 UDF 与模块封装团队自研逻辑,实现“策略组内复用 + 机构内共享” | high |
| DolphinDB 模块 | 内置指标库 | WorldQuant 101 Alpha 因子指标库:https://docs.dolphindb.cn/zh/modules/wq101alpha/wq101alpha.html | high |
| DolphinDB 模块 | 内置指标库 | 技术分析指标库:https://docs.dolphindb.cn/zh/modules/ta/ta.html | high |
| DolphinDB 模块 | 内置指标库 | MyTT 指标库:https://docs.dolphindb.cn/zh/modules/mytt/mytt.html | high |
| DolphinDB 模块 | 内置指标库 | CSAP 截面因子指标库:https://docs.dolphindb.cn/zh/2.00.16/tutorials/csap.html | high |
| 因子计算资料 | 最佳实践链接 | 因子计算最佳实践:https://docs.dolphindb.cn/zh/tutorials/best_practice_for_factor_calculation.html | high |
| 因子计算资料 | 实践链接 | 基于 Level-2 行情数据的因子计算实践:https://docs.dolphindb.cn/zh/tutorials/l2_stk_data_proc_2.html | high |
| 因子实现案例库 | 链接 | 通用金融因子:https://docs.dolphindb.cn/zh/tutorials/str_comp_fin_quant_2.html | high |
| 因子实现案例库 | 链接 | ETF 期权隐含波动率和希腊值:https://docs.dolphindb.cn/zh/tutorials/IV_Greeks_Calculation_for_ETF_Options_Using_JIT.html | high |
| 因子实现案例库 | 链接 | 深度不平衡/买卖压力指标/波动率计算:https://docs.dolphindb.cn/zh/tutorials/sql_performance_optimization_wap_di_rv.html | high |
| 因子实现案例库 | 链接 | 股票复权因子和复权行情:https://docs.dolphindb.cn/zh/tutorials/market_condition_adjustments.html | high |
| 因子实现案例库 | 链接 | 基金日频因子:https://docs.dolphindb.cn/zh/tutorials/fund_factor_contrasted_by_py.html | high |
| 因子实现方案对比 | 对比主题与链接 | Python+HDF5 vs. DolphinDB 一体化因子计算方案:https://docs.dolphindb.cn/zh/tutorials/Python_HDF5_vs_DolphinDB.html | high |
| 因子实现方案对比 | 对比主题与链接 | Python+文件存储 vs DolphinDB 因子计算:https://docs.dolphindb.cn/zh/tutorials/DolphinDB_VS_PythonFile_Storage.html | high |
| DolphinDB 流批一体架构 | 部署复用能力 | 投研环境中基于历史数据开发的因子计算逻辑,无需改写可直接部署到实盘流式计算环境 | high |
| DolphinDB 流批一体架构 | 一致性主张 | 确保回测与实盘的因子值完全一致 | medium |
| DolphinDB 流批一体架构 | 开发模式描述 | “一次开发、处处运行” | medium |
| 传统双栈开发痛点 | 被消除的困扰 | 消除了传统 Python 研发 + C++ 生产的双栈开发困扰 | low |
| 策略上线周期 | 缩短幅度 | 可缩短 80% 以上 | medium |
| 流批一体因子开发 | 数据更新能力 | 支持因子的历史批量回填和实时增量更新 | high |
| 从因子创意到实盘验证闭环 | 耗时 | 可在数小时内完成 | medium |
| 流批一体因子开发资料 | 教程链接 | 搭建 Level-2 快照数据流批一体因子计算平台:https://docs.dolphindb.cn/zh/tutorials/l2_snapshot_factor_calc_2.html | high |
| 流批一体因子开发资料 | 教程链接 | 实时高频因子的实现:https://docs.dolphindb.cn/zh/tutorials/hf_factor_streaming_2.html | high |
| 实时场景教程 | 链接 | 分钟资金流:https://docs.dolphindb.cn/zh/tutorials/streaming_capital_flow_order_by_order_2.html | high |
| 实时场景教程 | 链接 | 日累计逐单资金流:https://docs.dolphindb.cn/zh/tutorials/streaming_capital_flow_daily_2.html | high |
| 实时场景教程 | 链接 | 实时涨幅榜:https://docs.dolphindb.cn/zh/tutorials/rt_stk_price_inc_calc_2.html | high |
| DolphinDB 多因子建模 | 能力依托 | 依托高性能分布式 JOIN 与时序计算引擎 | high |
| DolphinDB 多因子建模 | 数据对齐与产出 | 将筛选的因子与行情、财务、持仓、交易及风险因子按时间与标的对齐,一步生成建模所需的特征表和标签集 | high |
| 多因子框架(库内) | 支持的传统模型 | 线性加权、截面回归、IC 加权等传统多因子模型 | high |
| 多因子框架(用途) | 模型输出与用途 | 生成标的打分或预期收益,用于选股和择时 | high |
| DolphinDB 风险因子与组合约束 | 内置框架 | 内置多因子风险模型框架(链接:https://docs.dolphindb.cn/zh/tutorials/multi_factor_risk_model.html) | high |
| 多因子风险模型框架 | 用途 | 用于因子暴露分析与收益归因,并在多重限制下完成组合优化、求解最优权重 | high |
| DolphinDB 机器学习与深度学习建模 | 内置框架 | 内置机器学习框架(链接:https://docs.dolphindb.cn/zh/tutorials/machine_learning.html) | high |
| DolphinDB 建模插件/工具 | 支持组件 | XGBoost、AI Dataloader(https://docs.dolphindb.cn/zh/dataloaderdoc/ai_dataloader_ml.html)、LibTorch(https://docs.dolphindb.cn/zh/tutorials/dolphindb_tensor_libtorch_tutorial.html) | high |
| DolphinDB 建模流程 | 训练与推理位置 | 在 DolphinDB 内完成大规模因子样本的模型训练与实时推理 | medium |
| 机器学习框架示例 | 教程链接 | 金融实时实际波动率预测:https://docs.dolphindb.cn/zh/tutorials/ml_volatility_2.html | high |
| XGBoost 插件应用示例 | 教程链接 | 开发股票波动率预测模型的676个输入特征:https://docs.dolphindb.cn/zh/tutorials/metacode_derived_features_2.html | high |
| AI Dataloader 与 Libtorch 工具应用示例 | 教程链接 | 通过深度学习进行股票实时波动率预测:https://docs.dolphindb.cn/zh/tutorials/volatility_prediction.html | high |
| DolphinDB 因子自动挖掘 | 能力定位 | 为已构建大规模因子库的机构提供基于统一数据底座的因子自动挖掘能力,支持从海量历史数据中自动搜索潜在 Alpha | medium |
| Shark GPLearn | 框架类型与方法 | 基于遗传算法的因子自动挖掘框架,通过符号回归自动生成与数据分布相拟合的 Alpha 表达式 | high |
| Shark GPLearn | 相对开源 gplearn 的能力 | 提供 GPU 加速、整合 DolphinDB 丰富的算子库、原生支持“时间 × 股票 × 因子”的三维面板数据处理 | high |
| Shark GPLearn | 效果主张 | 大幅缩短“生成-筛选-回测”迭代周期,并在统一平台实现“人工设计 + 自动挖掘”组合研究流程、提升研究产出效率 | low |
| Shark GPLearn | 试用入口 | https://dolphindb.cn/product#shark | high |
| Shark GPLearn 资料 | 教程链接 | Shark GPLearn 因子挖掘快速上手:https://docs.dolphindb.cn/zh/tutorials/gplearn.html | high |
| Shark GPLearn 资料 | 白皮书链接 | 高性能因子挖掘平台白皮书:https://dolphindb.cn/whitepaper/shark | high |
| 因子管理平台 | 定位 | 覆盖因子全生命周期的一体化管理平台,贯穿数据管理、因子研究、因子评估、策略回测的完整投研流程 | high |
| 因子管理平台 | 元数据自动记录内容 | 自动记录每个因子的计算逻辑、数据依赖、历史表现、应用策略等元数据 | high |
| 因子管理平台 | 追溯与分析能力 | 支持因子血缘追溯和影响分析 | high |
| 因子管理平台 | 支持查看的核心指标 | 可查看因子 IC、IC_IR、多空收益等核心指标并对比不同因子表现进行组合优化 | high |
| 因子管理平台 | 协作机制 | 多用户协作机制让团队成员共享因子研究成果,避免重复开发 | medium |
| 因子管理平台(Starfish) | 试用入口 | https://dolphindb.cn/product#starfish | high |
| 因子管理平台资料 | 快速上手链接 | 因子开发平台快速上手:https://docs.dolphindb.cn/zh/starfish/factor_dev.html | high |
| 因子管理平台资料 | 白皮书链接 | 因子开发管理平台白皮书:https://dolphindb.cn/whitepaper/starfish | high |
| DolphinDB 中高频回测框架 | 组成 | 集数据回放、模拟撮合引擎、回测引擎于一体 | high |
| 事件驱动回测引擎 | 数据流分发 | 将历史数据流同步分发至模拟撮合引擎与策略回调函数 | high |
| 回测引擎 | 风控校验内容 | 执行风控校验(资金、持仓、涨跌停等约束) | high |
| 模拟撮合模块 | 作用 | 通过审核的订单进入模拟撮合模块完成成交仿真,并根据成交结果实时更新账户状态 | high |
| DolphinDB 回测框架 | 覆盖资产品种 | 覆盖股票、期权、期货、银行间债券、数字货币等多资产品种 | medium |
| 对比回测工具 | 被对比对象 | Backtrader、MetaTrader4 | high |
| DolphinDB 回测框架 | 核心实现语言 | 核心撮合与回测引擎采用 C++ 实现 | high |
| DolphinDB 回测框架性能 | 相对 Python 框架的提升 | 在全市场、多标的、中高频数据量级下相较 Python 框架可实现最高数十倍的性能提升 | medium |
| 回测资料 | 快速上手链接 | 快速上手 DolphinDB 回测:https://docs.dolphindb.cn/zh/plugins/backtest/quick_start.html | high |
| 回测资料 | 性能优化攻略链接 | DolphinDB 回测平台使用和性能优化攻略:https://docs.dolphindb.cn/zh/plugins/backtest/performance_tuning.html | high |
| 回测对比分析资料 | 链接 | DolphinDB 回测平台与其它回测产品的对比分析:https://docs.dolphindb.cn/zh/plugins/performance_comparison.html | high |
| DolphinDB 模拟撮合引擎插件 | 功能 | 精确仿真订单在真实市场中的成交过程 | high |
| 模拟撮合引擎插件 | 输入数据类型 | 接收实时行情数据(快照或逐笔)与策略委托订单(限价、市价、撤单) | high |
| 模拟撮合引擎插件 | 撮合规则 | 按价格优先、时间优先规则构建虚拟订单簿,动态计算成交价格、成交数量与成交时间 | high |
| 模拟撮合引擎插件 | 可配置参数 | 支持配置通道延迟、成交比例等参数 | high |
| 逐笔行情撮合 | 处理方式 | 实时合成 Tick 级订单簿并与后续委托持续撮合 | high |
| 快照行情撮合 | 处理方式 | 可配置未成交订单是否跨快照排队等待 | high |
| 撮合算法 | 算法类型示例 | 可基于最新成交价与对手盘口按比例撮合;或基于区间成交明细叠加盘口深度进行成交仿真 | high |
| 模拟撮合的价值 | 用途描述 | 帮助高频和日内策略将“理想回测收益”校正为更贴近实盘环境的“可实现收益”,用于评估滑点、流动性约束和冲击成本影响 | medium |
| 模拟撮合资料 | 教程链接 | 模拟撮合引擎使用教程:https://docs.dolphindb.cn/zh/tutorials/matching_engine_simulator.html | high |
| Swordfish 嵌入式解决方案 | 调用方式 | 支持在 Python 和 C++ 应用程序中直接调用 DolphinDB 高性能计算引擎,无需通过网络连接数据库 | high |
| Swordfish 方案 | 目标团队 | 券商自营投研团队 | high |
| Swordfish 方案 | 对现有代码的影响 | 已有 Python 研究脚本和 C++ 策略程序可在不改写核心业务逻辑前提下获得 DolphinDB 流式计算与分布式处理能力 | medium |
| Swordfish 方案 | 数据处理时延级别主张 | 实现毫秒级数据处理和大规模并行计算 | low |
| 进程内调用架构 | 优势描述 | 保留原有代码资产和开发习惯,同时提升计算性能和数据处理效率,降低平台迁移成本和技术风险 | low |
| Swordfish 资料 | 教程链接 | C++ Swordfish 方案:https://docs.dolphindb.cn/zh/tutorials/backtesting_using_MatchingEngineSimulator.html | high |
| DolphinDB AI 智能投研系统 | 定位 | 将大语言模型与量化研究深度融合,投研人员可通过自然语言完成复杂分析任务 | medium |
| 研报因子复现 Agent | 能力描述 | 可输入研报 PDF 自动识别因子逻辑并生成可执行代码 | medium |
| 因子迭代 Agent | 能力描述 | 基于历史表现自动推荐调参方向和因子组合方案 | medium |
| 组合管理 Agent | 能力描述 | 支持自然语言查询组合收益、风险归因、行业暴露等指标并生成分析报表 | medium |
| 智能选股 Agent | 能力描述 | 结合市场表现、财务因子与投资逻辑自动生成股票池并给出选股理由 | medium |
| AI 智能投研系统 | 术语理解能力描述 | 通过语料训练理解“市值中性化”“行业轮动”“动量反转”等术语,并自动生成 DolphinDB 计算脚本并返回结果 | low |
| AI 智能投研系统 | 适用人群描述 | 降低技术门槛,使非技术背景研究员可高效完成量化分析,并为资深量化团队提供辅助工具以加速迭代周期 | low |