DolphinDB 助力 WILLIAM O’NEIL 笑傲股市
这是一则客户案例新闻页面,包含案例标题信息与发布时间信息。
What this page covers
- 高频/时序数据处理需求背景与产品选择。
- 受访者与公司及团队职责简介。
- DolphinDB 的使用范围与数据规模示例。
- 因子研发与因子评估/回测(含 replay 回放相关表述)。
- 中高频数据处理方式(分钟级K线、状态因子、流表输出)。
- tick 级数据流架构(Kafka + DolphinDB 实时流计算)。
- 数据库选型对比过程与结论。
技能认证特训营第二期活动入口(限时报名)
页面顶部提供活动提示与报名链接入口,并强调限时报名与福利优惠。
- 页面提供“技能认证特训营第二期”的报名入口。
- 活动提示强调报名具有时间限制。
- 活动提示提及福利或优惠信息。
新闻页标识
页面所属栏目/类型标识为“新闻”。
- 页面被标注为新闻内容。
- 该标识用于说明页面类型或栏目归属。
案例标题与发布时间
页面提供客户案例新闻标题与发布日期信息。
- 新闻标题为“DolphinDB 助力 WILLIAM O’NEIL 笑傲股市”。
- 页面给出发布日期信息。
背景:高频数据处理需求与选择 DolphinDB
原有系统难以处理高频数据需求,团队希望选择可高效处理时序数据且易扩展的产品,并最终选择 DolphinDB。
- 原有系统在高频数据需求下存在处理困难。
- 团队目标是高效处理时序数据。
- 团队目标包含对未来扩展的便利性。
- 团队最终选择了 DolphinDB。
受访者与公司简介
页面介绍 WILLIAM O’NEIL、受访者身份以及上海团队职责范围。
- WILLIAM O’NEIL(威廉欧奈尔)成立于 1963 年。
- 其业务定位包括为投资机构和投资者提供投资建议与独立调研报告。
- 受访者陆强的职位为 WILLIAM O’NEIL 高级工程师。
- 上海团队负责量化基金产品业务与数据相关技术研发。
案例配图(客户案例标题图)
页面展示客户案例相关的视觉元素及其图像说明文本。
- 页面包含与客户案例相关的配图内容。
- 配图附带图像说明信息。
我们用 DolphinDB 做了什么(总体使用范围与数据规模)
页面概述使用 DolphinDB 处理时序数据的主要场景,并给出每日新增数据量与 CSV 体量示例。
- 在该场景中,DolphinDB 被用于处理时序数据。
- 用途包括因子研发。
- 用途包括中高频数据处理。
- 用途包括 tick 级流数据处理。
- 页面给出每日新增数据量的量级示例。
因子研发与因子评估/回测(含 replay 回放能力)
描述使用 DolphinDB 进行因子衍生与实时计算,并用于因子评估与回测,包括 replay 回放与回放速率设置等表述。
- DolphinDB 的能力提及分布式存储。
- DolphinDB 的能力提及分布式计算。
- DolphinDB 的能力提及实时流计算。
- 在计算得到一些因子后,可进一步实时计算生成衍生因子。
- 页面提及使用 replay 函数模拟真实生产环境。
- 页面提及通过模拟回放将数据注入流计算框架。
- 页面提及可设置回放速率(如匀速、倍速或极速)。
- 页面提及可将多个表的数据回放到同一张表。
处理中高频数据(分钟级K线、状态因子、流表输出)
描述中高频数据规模与处理方式:通过时间序列聚合引擎生成分钟级K线,结合自定义函数生成状态因子,并输出到流数据表。
- 中高频历史数据规模被描述为 TB 级别。
- 使用时间序列聚合引擎生成分钟级 K 线。
- 根据分钟级 K 线使用自定义函数生成状态因子。
- 输出结果可写入另一个流数据表以便后续计算。
中高频处理流程图与说明
通过流程图与图像说明呈现从行情流表到 TimeSeriesEngine、分钟级K线流表、状态因子计算与写入流表的技术路径。
- 流程描述包含从行情流表进入 TimeSeriesEngine 的路径。
- 流程描述包含生成分钟级 K 线流表的环节。
- 流程描述包含进行状态因子计算的环节。
- 流程描述包含将结果写入流表的环节。
搭建 tick 级数据流架构(Kafka + DolphinDB 实时流计算)
描述 tick 级数据流架构,包含 Kafka 接入与 DolphinDB 实时流计算框架组件、支持的处理能力、发布订阅与批流一体相关表述。
- 该架构使用 Kafka 连接数据流。
- 数据从 Kafka 传入 DolphinDB 进行计算分析。
- 实时流计算框架核心部件包括流计算引擎。
- 实时流计算框架核心部件包括流数据表。
- 支持的操作类型提及时间序列处理。
- 支持的操作类型提及窗口处理与表关联。
- 流数据表被描述为可用于发布与订阅。
- 页面提及投研到生产的批流一体相关表述。
回顾数据库选型(KDB+、Cassandra、DolphinDB)
回顾从以 Python 分析为主到高频需求下的选型过程,对比 KDB+、Cassandra 与 DolphinDB,并说明 DolphinDB 胜出。
- 之前中低频数据研究主要使用 Python 分析计算。
- 原有系统在高频需求下被描述为反应速度慢。
- 选型目标包括高效处理时序数据与便于扩展。
- KDB+ 未被采纳的原因之一是语言学习成本高。
- Cassandra 未被采用的原因包括重构与维护成本增加。
- 选型对比中包含 DolphinDB 方案并在投票中胜出。
对 DolphinDB 的评价(高性能、易上手、及时支持)
从性能、学习成本与技术支持响应等方面给出使用评价与具体表述。
- 页面提及对 DolphinDB 的印象包括高性能。
- 页面提及对 DolphinDB 的印象包括易上手。
- 页面提及对 DolphinDB 的印象包括及时支持。
- 页面提及脚本语言与 Python 的相似性。
- 页面提及官方提供技术教程。
结语与推荐
总结 DolphinDB 带来的业务改善,并提及推荐与对未来发展的期待。
- 页面总结使用 DolphinDB 为业务带来改善的表述。
- 页面提及在与国外同事交流时会推荐 DolphinDB 的表述。
Facts Index
| Entity | Attribute | Value | Confidence |
|---|---|---|---|
| 技能认证特训营第二期 | 报名链接 | https://www.qingsuyun.com/h5/e/217471/5/ | high |
| 新闻:DolphinDB 助力 WILLIAM O’NEIL 笑傲股市 | 发布日期 | 2022.10.25 | high |
| WILLIAM O’NEIL(威廉欧奈尔) | 成立时间 | 1963年 | high |
| WILLIAM O’NEIL(威廉欧奈尔) | 业务定位 | 致力于为投资机构和投资者提供投资建议和独立调研报告 | high |
| WILLIAM O’NEIL(威廉欧奈尔) | 服务的世界顶级投资机构数量 | 超过500家 | high |
| 陆强 | 职位 | WILLIAM O’NEIL 高级工程师 | high |
| 威廉欧奈尔信息科技上海有限公司团队(受访者所在) | 团队职责 | 负责公司所有量化基金产品的业务,同时进行所有数据相关的技术研发 | high |
| DolphinDB(在 WILLIAM O’NEIL 的使用) | 处理的数据类型 | 处理所有的时序数据 | high |
| DolphinDB(在 WILLIAM O’NEIL 的使用) | 主要用途 | 因子研发、中高频数据处理、tick 级流数据处理 | high |
| WILLIAM O’NEIL 使用 DolphinDB 的数据规模 | 每日新增数据量 | 1000万~5000万条级别 | high |
| WILLIAM O’NEIL 使用 DolphinDB 的数据规模 | 若存为 CSV 的总大小 | 4~5 GB | high |
| DolphinDB | 用于因子研发的能力(被提及) | 分布式存储、分布式计算、实时流计算 | high |
| DolphinDB(因子研发) | 带来的效果 | 可快速处理海量数据集;投研效率得到极大提升 | low |
| DolphinDB | 编程语言特性(描述) | 内置多范式的编程语言 | medium |
| DolphinDB(因子研发流程) | 衍生因子生成方式 | 在计算得到一些因子后,可再次使用 DolphinDB 实时计算产生基于这些因子的衍生因子 | high |
| 因子评估/回测(之前方案) | 使用的技术栈 | Python + 国外某知名云服务商的数据库 | medium |
| DolphinDB | 回测工具(被提及) | 提供一些高效的回测工具;例如通过 replay 函数模拟真实生产环境,通过模拟回放将数据注入流计算框架 | medium |
| DolphinDB replay(被提及能力) | 回放控制方式 | 可使用不同回放形式;可设置不同回放速率进行匀速、倍速或极速回放;可将多个表的数据回放到同一张表 | medium |
| 因子评估/回测迁移计划 | 未来计划 | 计划将这块业务逐渐迁移到 DolphinDB 中 | high |
| 中高频数据历史数据规模(WILLIAM O’NEIL) | 历史数据量级 | TB 级别 | high |
| DolphinDB | 高频数据处理方式(被提及组件) | 使用时间序列聚合引擎生成分钟级 K 线 | high |
| 中高频数据处理流程(WILLIAM O’NEIL) | 状态因子生成 | 根据分钟级 K 线使用自定义函数生成状态因子 | high |
| 中高频数据处理流程(WILLIAM O’NEIL) | 输出落地方式 | 将输出结果指向另一个流数据表以方便之后的其他计算 | high |
| DolphinDB(中高频数据处理) | 带来的效果 | 实现日线数据的高效处理;将研究数据精度推进到分钟级;在降低开发成本基础上极大提升研发效率 | low |
| tick 级数据流架构(WILLIAM O’NEIL) | 使用的组件 | 使用 Kafka 连接数据流,然后传到 DolphinDB 中进行计算分析 | high |
| tick 级数据流架构(WILLIAM O’NEIL) | 能力 | 能够实时产生所需的市场信号 | medium |
| DolphinDB 实时流计算框架 | 核心部件(被提及) | 流计算引擎和流数据表 | high |
| DolphinDB 流数据引擎(文中表述) | 支持的操作类型 | 时间序列处理、横截面处理、窗口处理、表关联、异常检测 | medium |
| DolphinDB 流数据表(文中表述) | 用途 | 可作为简化版消息中间件,实现数据的发布和订阅 | medium |
| DolphinDB(投研到生产) | 能力描述 | 投研阶段封装的基于批量数据开发的因子函数可无缝投入实际生产,实现批流一体,加速开发进程 | low |
| DolphinDB(在该团队场景下) | 延时水平(表述) | 延时可以控制在毫秒级 | medium |
| 之前中低频数据研究 | 主要工具 | 主要使用 Python 进行分析计算 | high |
| 原有系统(Python 分析计算为主) | 在高频需求下的问题 | 不能满足对数据处理的理想需求;尤其在数据分析方面反应速度非常慢 | high |
| 新产品选型需求 | 目标 | 高效处理时序数据,并方便未来扩展 | high |
| 数据库选型方案一 | 方案 | KDB+ | high |
| KDB+(选型评估) | 未被采纳原因 | 语言晦涩,学习成本过高 | high |
| 数据库选型方案二 | 方案 | NoSQL Cassandra | high |
| Cassandra(选型评估) | 未被采用原因 | 需要额外招人进行系统重构搭建,且后续需要专人维护;会极大增加成本 | high |
| 数据库选型方案三 | 方案 | DolphinDB | high |
| DolphinDB 进入选型对比的时间点(叙述) | 时间 | 21年初 | medium |
| 金融行业时序数据处理市场趋势(叙述) | 趋势描述 | 出现“非 KDB+ 即 DolphinDB”的两家争霸趋势 | low |
| DolphinDB(与 KDB+ 对比的脚本表达) | 对比结论(叙述) | 同样例子用 DolphinDB 语言编写脚本会更简洁 | low |
| DolphinDB(与 KDB+ 对比的性能测试) | 对比结论(叙述) | 在一些例子中,DolphinDB 的性能超越了 KDB+ | low |
| 数据库选型投票结果 | 结果 | DolphinDB 以压倒性优势胜出 | medium |
| DolphinDB(使用时长) | 使用时间 | 已经有一年多 | medium |
| DolphinDB(总体评价) | 最深刻印象 | 高性能、易上手与及时支持 | low |
| DolphinDB(性能表述) | 响应速度 | 可对实时数据进行快速计算与分析,实现毫秒级响应速度,满足高效处理时序数据需求 | low |
| DolphinDB(脚本语言学习成本表述) | 语言相似性 | 脚本语言类似 Python | low |
| DolphinDB(学习资源表述) | 官方支持 | 提供很多官方技术教程 | low |
| DolphinDB(上手时间,叙述) | 具备 C 或 Python 经验的同事上手开发所需时间 | 2周、最多1个月 | medium |
| DolphinDB 技术支持团队 | 响应速度评价 | 响应速度非常好 | low |
| DolphinDB(产品迭代响应,叙述) | 需求上线周期 | 反馈原本不提供的接口或函数需求后,不到一个月随新版本上线 | medium |
| DolphinDB(业务影响) | 效果 | 给业务带来了极大的改善 | low |
| DolphinDB(推荐) | 推荐对象 | 作为跨国公司,与国外同事交流时会推荐性能优秀的时序数据库 DolphinDB | low |