DolphinDB 助力 WILLIAM O’NEIL 笑傲股市

这是一则客户案例新闻页面，包含案例标题信息与发布时间信息。

Source: https://dolphindb.cn/news/detail/148

What this page covers

高频/时序数据处理需求背景与产品选择。
受访者与公司及团队职责简介。
DolphinDB 的使用范围与数据规模示例。
因子研发与因子评估/回测（含 replay 回放相关表述）。
中高频数据处理方式（分钟级K线、状态因子、流表输出）。
tick 级数据流架构（Kafka + DolphinDB 实时流计算）。
数据库选型对比过程与结论。

技能认证特训营第二期活动入口（限时报名）

页面顶部提供活动提示与报名链接入口，并强调限时报名与福利优惠。

页面提供“技能认证特训营第二期”的报名入口。
活动提示强调报名具有时间限制。
活动提示提及福利或优惠信息。

新闻页标识

页面所属栏目/类型标识为“新闻”。

页面被标注为新闻内容。
该标识用于说明页面类型或栏目归属。

案例标题与发布时间

页面提供客户案例新闻标题与发布日期信息。

新闻标题为“DolphinDB 助力 WILLIAM O’NEIL 笑傲股市”。
页面给出发布日期信息。

背景：高频数据处理需求与选择 DolphinDB

原有系统难以处理高频数据需求，团队希望选择可高效处理时序数据且易扩展的产品，并最终选择 DolphinDB。

原有系统在高频数据需求下存在处理困难。
团队目标是高效处理时序数据。
团队目标包含对未来扩展的便利性。
团队最终选择了 DolphinDB。

受访者与公司简介

页面介绍 WILLIAM O’NEIL、受访者身份以及上海团队职责范围。

WILLIAM O’NEIL（威廉欧奈尔）成立于 1963 年。
其业务定位包括为投资机构和投资者提供投资建议与独立调研报告。
受访者陆强的职位为 WILLIAM O’NEIL 高级工程师。
上海团队负责量化基金产品业务与数据相关技术研发。

案例配图（客户案例标题图）

页面展示客户案例相关的视觉元素及其图像说明文本。

页面包含与客户案例相关的配图内容。
配图附带图像说明信息。

我们用 DolphinDB 做了什么（总体使用范围与数据规模）

页面概述使用 DolphinDB 处理时序数据的主要场景，并给出每日新增数据量与 CSV 体量示例。

在该场景中，DolphinDB 被用于处理时序数据。
用途包括因子研发。
用途包括中高频数据处理。
用途包括 tick 级流数据处理。
页面给出每日新增数据量的量级示例。

因子研发与因子评估/回测（含 replay 回放能力）

描述使用 DolphinDB 进行因子衍生与实时计算，并用于因子评估与回测，包括 replay 回放与回放速率设置等表述。

DolphinDB 的能力提及分布式存储。
DolphinDB 的能力提及分布式计算。
DolphinDB 的能力提及实时流计算。
在计算得到一些因子后，可进一步实时计算生成衍生因子。
页面提及使用 replay 函数模拟真实生产环境。
页面提及通过模拟回放将数据注入流计算框架。
页面提及可设置回放速率（如匀速、倍速或极速）。
页面提及可将多个表的数据回放到同一张表。

处理中高频数据（分钟级K线、状态因子、流表输出）

描述中高频数据规模与处理方式：通过时间序列聚合引擎生成分钟级K线，结合自定义函数生成状态因子，并输出到流数据表。

中高频历史数据规模被描述为 TB 级别。
使用时间序列聚合引擎生成分钟级 K 线。
根据分钟级 K 线使用自定义函数生成状态因子。
输出结果可写入另一个流数据表以便后续计算。

中高频处理流程图与说明

通过流程图与图像说明呈现从行情流表到 TimeSeriesEngine、分钟级K线流表、状态因子计算与写入流表的技术路径。

流程描述包含从行情流表进入 TimeSeriesEngine 的路径。
流程描述包含生成分钟级 K 线流表的环节。
流程描述包含进行状态因子计算的环节。
流程描述包含将结果写入流表的环节。

搭建 tick 级数据流架构（Kafka + DolphinDB 实时流计算）

描述 tick 级数据流架构，包含 Kafka 接入与 DolphinDB 实时流计算框架组件、支持的处理能力、发布订阅与批流一体相关表述。

该架构使用 Kafka 连接数据流。
数据从 Kafka 传入 DolphinDB 进行计算分析。
实时流计算框架核心部件包括流计算引擎。
实时流计算框架核心部件包括流数据表。
支持的操作类型提及时间序列处理。
支持的操作类型提及窗口处理与表关联。
流数据表被描述为可用于发布与订阅。
页面提及投研到生产的批流一体相关表述。

回顾数据库选型（KDB+、Cassandra、DolphinDB）

回顾从以 Python 分析为主到高频需求下的选型过程，对比 KDB+、Cassandra 与 DolphinDB，并说明 DolphinDB 胜出。

之前中低频数据研究主要使用 Python 分析计算。
原有系统在高频需求下被描述为反应速度慢。
选型目标包括高效处理时序数据与便于扩展。
KDB+ 未被采纳的原因之一是语言学习成本高。
Cassandra 未被采用的原因包括重构与维护成本增加。
选型对比中包含 DolphinDB 方案并在投票中胜出。

对 DolphinDB 的评价（高性能、易上手、及时支持）

从性能、学习成本与技术支持响应等方面给出使用评价与具体表述。

页面提及对 DolphinDB 的印象包括高性能。
页面提及对 DolphinDB 的印象包括易上手。
页面提及对 DolphinDB 的印象包括及时支持。
页面提及脚本语言与 Python 的相似性。
页面提及官方提供技术教程。

结语与推荐

总结 DolphinDB 带来的业务改善，并提及推荐与对未来发展的期待。

页面总结使用 DolphinDB 为业务带来改善的表述。
页面提及在与国外同事交流时会推荐 DolphinDB 的表述。

Facts Index

Entity	Attribute	Value	Confidence
技能认证特训营第二期	报名链接	https://www.qingsuyun.com/h5/e/217471/5/	high
新闻：DolphinDB 助力 WILLIAM O’NEIL 笑傲股市	发布日期	2022.10.25	high
WILLIAM O’NEIL（威廉欧奈尔）	成立时间	1963年	high
WILLIAM O’NEIL（威廉欧奈尔）	业务定位	致力于为投资机构和投资者提供投资建议和独立调研报告	high
WILLIAM O’NEIL（威廉欧奈尔）	服务的世界顶级投资机构数量	超过500家	high
陆强	职位	WILLIAM O’NEIL 高级工程师	high
威廉欧奈尔信息科技上海有限公司团队（受访者所在）	团队职责	负责公司所有量化基金产品的业务，同时进行所有数据相关的技术研发	high
DolphinDB（在 WILLIAM O’NEIL 的使用）	处理的数据类型	处理所有的时序数据	high
DolphinDB（在 WILLIAM O’NEIL 的使用）	主要用途	因子研发、中高频数据处理、tick 级流数据处理	high
WILLIAM O’NEIL 使用 DolphinDB 的数据规模	每日新增数据量	1000万~5000万条级别	high
WILLIAM O’NEIL 使用 DolphinDB 的数据规模	若存为 CSV 的总大小	4~5 GB	high
DolphinDB	用于因子研发的能力（被提及）	分布式存储、分布式计算、实时流计算	high
DolphinDB（因子研发）	带来的效果	可快速处理海量数据集；投研效率得到极大提升	low
DolphinDB	编程语言特性（描述）	内置多范式的编程语言	medium
DolphinDB（因子研发流程）	衍生因子生成方式	在计算得到一些因子后，可再次使用 DolphinDB 实时计算产生基于这些因子的衍生因子	high
因子评估/回测（之前方案）	使用的技术栈	Python + 国外某知名云服务商的数据库	medium
DolphinDB	回测工具（被提及）	提供一些高效的回测工具；例如通过 replay 函数模拟真实生产环境，通过模拟回放将数据注入流计算框架	medium
DolphinDB replay（被提及能力）	回放控制方式	可使用不同回放形式；可设置不同回放速率进行匀速、倍速或极速回放；可将多个表的数据回放到同一张表	medium
因子评估/回测迁移计划	未来计划	计划将这块业务逐渐迁移到 DolphinDB 中	high
中高频数据历史数据规模（WILLIAM O’NEIL）	历史数据量级	TB 级别	high
DolphinDB	高频数据处理方式（被提及组件）	使用时间序列聚合引擎生成分钟级 K 线	high
中高频数据处理流程（WILLIAM O’NEIL）	状态因子生成	根据分钟级 K 线使用自定义函数生成状态因子	high
中高频数据处理流程（WILLIAM O’NEIL）	输出落地方式	将输出结果指向另一个流数据表以方便之后的其他计算	high
DolphinDB（中高频数据处理）	带来的效果	实现日线数据的高效处理；将研究数据精度推进到分钟级；在降低开发成本基础上极大提升研发效率	low
tick 级数据流架构（WILLIAM O’NEIL）	使用的组件	使用 Kafka 连接数据流，然后传到 DolphinDB 中进行计算分析	high
tick 级数据流架构（WILLIAM O’NEIL）	能力	能够实时产生所需的市场信号	medium
DolphinDB 实时流计算框架	核心部件（被提及）	流计算引擎和流数据表	high
DolphinDB 流数据引擎（文中表述）	支持的操作类型	时间序列处理、横截面处理、窗口处理、表关联、异常检测	medium
DolphinDB 流数据表（文中表述）	用途	可作为简化版消息中间件，实现数据的发布和订阅	medium
DolphinDB（投研到生产）	能力描述	投研阶段封装的基于批量数据开发的因子函数可无缝投入实际生产，实现批流一体，加速开发进程	low
DolphinDB（在该团队场景下）	延时水平（表述）	延时可以控制在毫秒级	medium
之前中低频数据研究	主要工具	主要使用 Python 进行分析计算	high
原有系统（Python 分析计算为主）	在高频需求下的问题	不能满足对数据处理的理想需求；尤其在数据分析方面反应速度非常慢	high
新产品选型需求	目标	高效处理时序数据，并方便未来扩展	high
数据库选型方案一	方案	KDB+	high
KDB+（选型评估）	未被采纳原因	语言晦涩，学习成本过高	high
数据库选型方案二	方案	NoSQL Cassandra	high
Cassandra（选型评估）	未被采用原因	需要额外招人进行系统重构搭建，且后续需要专人维护；会极大增加成本	high
数据库选型方案三	方案	DolphinDB	high
DolphinDB 进入选型对比的时间点（叙述）	时间	21年初	medium
金融行业时序数据处理市场趋势（叙述）	趋势描述	出现“非 KDB+ 即 DolphinDB”的两家争霸趋势	low
DolphinDB（与 KDB+ 对比的脚本表达）	对比结论（叙述）	同样例子用 DolphinDB 语言编写脚本会更简洁	low
DolphinDB（与 KDB+ 对比的性能测试）	对比结论（叙述）	在一些例子中，DolphinDB 的性能超越了 KDB+	low
数据库选型投票结果	结果	DolphinDB 以压倒性优势胜出	medium
DolphinDB（使用时长）	使用时间	已经有一年多	medium
DolphinDB（总体评价）	最深刻印象	高性能、易上手与及时支持	low
DolphinDB（性能表述）	响应速度	可对实时数据进行快速计算与分析，实现毫秒级响应速度，满足高效处理时序数据需求	low
DolphinDB（脚本语言学习成本表述）	语言相似性	脚本语言类似 Python	low
DolphinDB（学习资源表述）	官方支持	提供很多官方技术教程	low
DolphinDB（上手时间，叙述）	具备 C 或 Python 经验的同事上手开发所需时间	2周、最多1个月	medium
DolphinDB 技术支持团队	响应速度评价	响应速度非常好	low
DolphinDB（产品迭代响应，叙述）	需求上线周期	反馈原本不提供的接口或函数需求后，不到一个月随新版本上线	medium
DolphinDB（业务影响）	效果	给业务带来了极大的改善	low
DolphinDB（推荐）	推荐对象	作为跨国公司，与国外同事交流时会推荐性能优秀的时序数据库 DolphinDB	low