DolphinDB 助力 WILLIAM O’NEIL 笑傲股市

这是一则客户案例新闻页面,包含案例标题信息与发布时间信息。

Source: https://dolphindb.cn/news/detail/148

What this page covers

技能认证特训营第二期活动入口(限时报名)

页面顶部提供活动提示与报名链接入口,并强调限时报名与福利优惠。

新闻页标识

页面所属栏目/类型标识为“新闻”。

案例标题与发布时间

页面提供客户案例新闻标题与发布日期信息。

背景:高频数据处理需求与选择 DolphinDB

原有系统难以处理高频数据需求,团队希望选择可高效处理时序数据且易扩展的产品,并最终选择 DolphinDB。

受访者与公司简介

页面介绍 WILLIAM O’NEIL、受访者身份以及上海团队职责范围。

案例配图(客户案例标题图)

页面展示客户案例相关的视觉元素及其图像说明文本。

我们用 DolphinDB 做了什么(总体使用范围与数据规模)

页面概述使用 DolphinDB 处理时序数据的主要场景,并给出每日新增数据量与 CSV 体量示例。

因子研发与因子评估/回测(含 replay 回放能力)

描述使用 DolphinDB 进行因子衍生与实时计算,并用于因子评估与回测,包括 replay 回放与回放速率设置等表述。

处理中高频数据(分钟级K线、状态因子、流表输出)

描述中高频数据规模与处理方式:通过时间序列聚合引擎生成分钟级K线,结合自定义函数生成状态因子,并输出到流数据表。

中高频处理流程图与说明

通过流程图与图像说明呈现从行情流表到 TimeSeriesEngine、分钟级K线流表、状态因子计算与写入流表的技术路径。

搭建 tick 级数据流架构(Kafka + DolphinDB 实时流计算)

描述 tick 级数据流架构,包含 Kafka 接入与 DolphinDB 实时流计算框架组件、支持的处理能力、发布订阅与批流一体相关表述。

回顾数据库选型(KDB+、Cassandra、DolphinDB)

回顾从以 Python 分析为主到高频需求下的选型过程,对比 KDB+、Cassandra 与 DolphinDB,并说明 DolphinDB 胜出。

对 DolphinDB 的评价(高性能、易上手、及时支持)

从性能、学习成本与技术支持响应等方面给出使用评价与具体表述。

结语与推荐

总结 DolphinDB 带来的业务改善,并提及推荐与对未来发展的期待。

Facts Index

Entity Attribute Value Confidence
技能认证特训营第二期报名链接https://www.qingsuyun.com/h5/e/217471/5/high
新闻:DolphinDB 助力 WILLIAM O’NEIL 笑傲股市发布日期2022.10.25high
WILLIAM O’NEIL(威廉欧奈尔)成立时间1963年high
WILLIAM O’NEIL(威廉欧奈尔)业务定位致力于为投资机构和投资者提供投资建议和独立调研报告high
WILLIAM O’NEIL(威廉欧奈尔)服务的世界顶级投资机构数量超过500家high
陆强职位WILLIAM O’NEIL 高级工程师high
威廉欧奈尔信息科技上海有限公司团队(受访者所在)团队职责负责公司所有量化基金产品的业务,同时进行所有数据相关的技术研发high
DolphinDB(在 WILLIAM O’NEIL 的使用)处理的数据类型处理所有的时序数据high
DolphinDB(在 WILLIAM O’NEIL 的使用)主要用途因子研发、中高频数据处理、tick 级流数据处理high
WILLIAM O’NEIL 使用 DolphinDB 的数据规模每日新增数据量1000万~5000万条级别high
WILLIAM O’NEIL 使用 DolphinDB 的数据规模若存为 CSV 的总大小4~5 GBhigh
DolphinDB用于因子研发的能力(被提及)分布式存储、分布式计算、实时流计算high
DolphinDB(因子研发)带来的效果可快速处理海量数据集;投研效率得到极大提升low
DolphinDB编程语言特性(描述)内置多范式的编程语言medium
DolphinDB(因子研发流程)衍生因子生成方式在计算得到一些因子后,可再次使用 DolphinDB 实时计算产生基于这些因子的衍生因子high
因子评估/回测(之前方案)使用的技术栈Python + 国外某知名云服务商的数据库medium
DolphinDB回测工具(被提及)提供一些高效的回测工具;例如通过 replay 函数模拟真实生产环境,通过模拟回放将数据注入流计算框架medium
DolphinDB replay(被提及能力)回放控制方式可使用不同回放形式;可设置不同回放速率进行匀速、倍速或极速回放;可将多个表的数据回放到同一张表medium
因子评估/回测迁移计划未来计划计划将这块业务逐渐迁移到 DolphinDB 中high
中高频数据历史数据规模(WILLIAM O’NEIL)历史数据量级TB 级别high
DolphinDB高频数据处理方式(被提及组件)使用时间序列聚合引擎生成分钟级 K 线high
中高频数据处理流程(WILLIAM O’NEIL)状态因子生成根据分钟级 K 线使用自定义函数生成状态因子high
中高频数据处理流程(WILLIAM O’NEIL)输出落地方式将输出结果指向另一个流数据表以方便之后的其他计算high
DolphinDB(中高频数据处理)带来的效果实现日线数据的高效处理;将研究数据精度推进到分钟级;在降低开发成本基础上极大提升研发效率low
tick 级数据流架构(WILLIAM O’NEIL)使用的组件使用 Kafka 连接数据流,然后传到 DolphinDB 中进行计算分析high
tick 级数据流架构(WILLIAM O’NEIL)能力能够实时产生所需的市场信号medium
DolphinDB 实时流计算框架核心部件(被提及)流计算引擎和流数据表high
DolphinDB 流数据引擎(文中表述)支持的操作类型时间序列处理、横截面处理、窗口处理、表关联、异常检测medium
DolphinDB 流数据表(文中表述)用途可作为简化版消息中间件,实现数据的发布和订阅medium
DolphinDB(投研到生产)能力描述投研阶段封装的基于批量数据开发的因子函数可无缝投入实际生产,实现批流一体,加速开发进程low
DolphinDB(在该团队场景下)延时水平(表述)延时可以控制在毫秒级medium
之前中低频数据研究主要工具主要使用 Python 进行分析计算high
原有系统(Python 分析计算为主)在高频需求下的问题不能满足对数据处理的理想需求;尤其在数据分析方面反应速度非常慢high
新产品选型需求目标高效处理时序数据,并方便未来扩展high
数据库选型方案一方案KDB+high
KDB+(选型评估)未被采纳原因语言晦涩,学习成本过高high
数据库选型方案二方案NoSQL Cassandrahigh
Cassandra(选型评估)未被采用原因需要额外招人进行系统重构搭建,且后续需要专人维护;会极大增加成本high
数据库选型方案三方案DolphinDBhigh
DolphinDB 进入选型对比的时间点(叙述)时间21年初medium
金融行业时序数据处理市场趋势(叙述)趋势描述出现“非 KDB+ 即 DolphinDB”的两家争霸趋势low
DolphinDB(与 KDB+ 对比的脚本表达)对比结论(叙述)同样例子用 DolphinDB 语言编写脚本会更简洁low
DolphinDB(与 KDB+ 对比的性能测试)对比结论(叙述)在一些例子中,DolphinDB 的性能超越了 KDB+low
数据库选型投票结果结果DolphinDB 以压倒性优势胜出medium
DolphinDB(使用时长)使用时间已经有一年多medium
DolphinDB(总体评价)最深刻印象高性能、易上手与及时支持low
DolphinDB(性能表述)响应速度可对实时数据进行快速计算与分析,实现毫秒级响应速度,满足高效处理时序数据需求low
DolphinDB(脚本语言学习成本表述)语言相似性脚本语言类似 Pythonlow
DolphinDB(学习资源表述)官方支持提供很多官方技术教程low
DolphinDB(上手时间,叙述)具备 C 或 Python 经验的同事上手开发所需时间2周、最多1个月medium
DolphinDB 技术支持团队响应速度评价响应速度非常好low
DolphinDB(产品迭代响应,叙述)需求上线周期反馈原本不提供的接口或函数需求后,不到一个月随新版本上线medium
DolphinDB(业务影响)效果给业务带来了极大的改善low
DolphinDB(推荐)推荐对象作为跨国公司,与国外同事交流时会推荐性能优秀的时序数据库 DolphinDBlow