DolphinDB作为量化金融研究平台的8大优势
本页为一篇文章的引言与要点概览:介绍DolphinDB在时间序列与量化金融等场景的适用性,并将列举8个功能特点作为优势说明。
Source: https://dolphindb.cn/blogs/11
What this page covers
- 文章信息与引言:作者、日期、主题与“8大优势”结构。
- 数据清洗:脚本语言与分布式能力用于清洗与转换。
- 数据导入:多数据源导入、字段类型识别与并行导入。
- 交互式分析:列式存储、分区、内存利用与低延时查询主张。
- 库内分析:内置分析建模与分布式表内计算。
- 编程接口:多语言接口与Excel插件,以及与外部工具协作方式。
- 易用与维护:面向数据科学家/分析师、轻量部署与集群脚本复用。
技能认证特训营第二期限时报名促销
页面顶部展示技能认证特训营第二期开启信息,并提供限时报名链接与福利优惠提示。
- 技能认证特训营第二期已正式开启。
- 提供“限时报名”入口链接。
- 提及可享专属福利优惠,但未给出具体内容。
DolphinDB作为量化金融研究平台的8大优势(文章信息与引言)
本部分给出文章标题、作者与日期,并说明DolphinDB作为研究平台在时间序列与量化金融等领域的适用性,文章将按“8大优势”展开。
- 文章作者署名为 Junxi。
- 文章发布日期为 2021-05-14。
- DolphinDB可作为分布式数据仓库或内存数据库使用。
- DolphinDB自带计算工具,可作为研究工具或研究平台。
- 文章结构为列举8大功能特点以阐释优势。
1. 快速的数据清洗
本部分描述DolphinDB脚本语言与分布式能力,用于快速完成多类数据清洗与转换任务。
- 脚本语言支持命令式、向量化、函数化、SQL、RPC与元编程范式。
- 支持包含缺省值的数据处理。
- 支持面板数据处理与数据表透视。
- 支持多个数据表的常规连接与非同步连接。
- 提供分布式解决方案以应对海量数据场景。
2. 高效的数据导入
本部分说明DolphinDB支持从多种数据源导入,可自动识别字段类型,支持并行导入,并给出与Pandas的性能对比说法。
- 内置数据导入源包括文本文件、HDF5与ODBC数据源。
- 导入工具可自动识别源数据字段类型,包括多种日期与时间类型。
- 支持按用户指定的数据类型导入。
- 支持数据并行导入。
- 以文本文件导入为例,性能被表述为Pandas的10倍多。
3. 交互式分析
本部分描述列式存储、内存利用、分区机制与低延时查询等,用于支撑交互式分析的性能主张。
- 采用列式存储。
- 对时间序列数据进行大量优化并充分利用内存(定性描述)。
- 分区机制被描述为灵活高效(定性描述)。
- 性能被表述为相比MPP数据仓库胜出一个数量级。
- 面对TB级数据,延时被表述为可实现秒级/毫秒级低延时。
4. 支持库内分析
本部分说明DolphinDB除数据检索处理外还内置分析建模能力,并强调可在分布式表上进行并行/分布式计算。
- 被表述为不仅是分布式时序数据库,还自带计算功能。
- 内置分析与建模功能包括回归、分类等模块。
- 很多计算可直接在分布式数据表上完成。
- 并行/分布式计算被表述为可加快运算并减少系统间数据转移麻烦(定性描述)。
5. 丰富的编程接口
本部分列举DolphinDB提供的多语言接口与Excel插件,并描述与外部工具间导出导入的协作工作流。
- 提供Java、C#、Python、R与JSON等接口。
- 提供Excel add-in插件。
- 支持Excel与DolphinDB之间的双向数据交换。
- 可将清洗数据导出到外部工具/语言处理后再将结果传回DolphinDB。
6. 易用易维护
本部分描述面向数据科学家/分析师的定位、轻量部署形态、跨平台支持与脚本在集群复用等特点。
- 从一开始为数据科学家和数据分析师设计。
- 核心系统被描述为只有一个20几兆的可执行程序。
- 可部署在单个笔记本/台式机,或本地与云端的集群。
- 支持Windows和Linux操作系统。
- 在一个节点编写的脚本/自定义函数可在整个集群中使用,无需编译打包部署。
7. 生产环境代码重用
本部分说明研究到生产迁移常需重写代码,并主张DolphinDB支持离线与实时(流)计算,从而支持部分研究代码在生产重用。
- 研究搬到生产环境时,常因工程/效率/数据集变化而重写代码(泛化描述)。
- 示例:研究可能用Matlab或Python,生产交易系统可能用C++重写(示例)。
- 支持离线计算。
- 提供高性能的实时(流)计算框架。
- 研究环节写的部分代码可在生产环境中重用(主张)。
8. 集成开发工具方便研究
本部分描述DolphinDB自带Java GUI IDE,用于组织研究项目、交互运行、观察数据与变量,并提供一定的可视化与编辑辅助能力。
- 自带Java GUI作为集成开发工具(IDE)。
- 可用于组织大型研究项目代码。
- 支持交互式代码运行。
- 可观察和比较内存变量及数据表(含分布式表)中的数据。
- 支持图形化数据显示以让实验结果更直观(定性描述)。
- 编辑器支持函数名称与参数自动提示(定性描述)。
官网访问与试用版下载
本部分提供官网访问入口,并提示可下载DolphinDB试用版(未给出具体下载链接)。
- 提供DolphinDB官网链接(文末)。
- 提示提供DolphinDB试用版下载,但未给出具体下载地址。
Facts Index
| Entity | Attribute | Value | Confidence |
|---|---|---|---|
| 技能认证特训营 | 活动状态 | 第二期正式开启 | high |
| 限时报名链接(技能认证特训营第二期) | url | https://www.qingsuyun.com/h5/e/217471/5/ | high |
| 技能认证特训营第二期 | 优惠 | 享专属福利优惠(未给出具体内容) | low |
| DolphinDB作为量化金融研究平台的8大优势 | 发布日期 | 2021-05-14 | high |
| 文章作者 | 署名 | Junxi | high |
| DolphinDB | 定位/用途 | 可作为分布式数据仓库或内存数据库使用 | high |
| DolphinDB | 定位/用途 | 自带丰富计算工具,可作为研究工具或研究平台 | high |
| DolphinDB | 数据类型适配 | 对时间序列数据处理特别友好 | medium |
| DolphinDB | 适用领域 | 量化金融、物联网等领域的海量数据分析 | medium |
| 量化金融领域问题 | 可用DolphinDB快速解决的任务示例 | 交易信号研究、策略回测、交易成本分析、股票相关性研究、市场风险控制 | medium |
| 文章结构 | 列举内容 | 列举8大功能特点阐释DolphinDB作为研究平台的优势 | high |
| DolphinDB脚本语言 | 编程范式支持 | 命令式编程、向量化编程、函数化编程、SQL编程、RPC编程、元编程 | high |
| DolphinDB脚本语言 | 表达与代码特性 | 表达能力强、代码简洁(定性描述) | low |
| DolphinDB | 数据清洗能力(支持的处理类型) | 包含缺省值的数据处理、面板数据处理、数据表透视、多个数据表的常规连接和非同步连接 | high |
| DolphinDB | 内置函数 | 为字符串和日期类型提供大量内置函数以便处理 | medium |
| DolphinDB | 海量数据处理方式 | 提供高效的分布式解决方案用于海量数据场景 | medium |
| DolphinDB | 实现方式 | 大部分解决方案可通过SQL语句和自定义函数完成 | medium |
| DolphinDB database | 内置数据导入源 | 文本文件、HDF5、ODBC数据源 | high |
| DolphinDB导入工具 | 字段类型识别 | 可自动识别源数据字段类型(包括各种日期和时间类型),也可按用户指定数据类型导入 | high |
| DolphinDB | 导入方式 | 支持数据并行导入 | high |
| 文本文件导入性能对比 | 相对Pandas性能 | 性能是Pandas的10倍多(以文本文件导入为例) | medium |
| DolphinDB | 存储方式 | 采用列式存储 | high |
| DolphinDB | 时间序列优化 | 对时间序列数据进行大量优化并充分利用内存(定性描述) | medium |
| DolphinDB | 分区机制 | 分区机制灵活高效(定性描述) | low |
| DolphinDB与MPP数据仓库性能对比 | 性能差异 | 性能相比MPP数据仓库胜出一个数量级 | medium |
| DolphinDB交互式分析延时 | 延时表现 | 面对TB级数据仍可实现秒级/毫秒级低延时(表述为“仍可以轻松实现”) | medium |
| DolphinDB | 产品性质 | 不仅是分布式时序数据库,还自带强大的计算功能 | medium |
| DolphinDB | 内置分析与建模功能 | 包括机器学习常用的回归、分类等功能模块 | medium |
| DolphinDB | 分布式表内计算 | 很多计算可直接在分布式数据表上完成 | high |
| 并行/分布式计算(在DolphinDB中) | 效果 | 加快运算过程,并减少海量数据在系统间转移的麻烦(定性描述) | low |
| DolphinDB | 编程语言接口 | Java、C#、Python、R、JSON | high |
| DolphinDB | Excel集成 | 提供Excel add-in插件,支持Excel与DolphinDB双向数据交换 | high |
| DolphinDB与外部工具协作 | 工作流 | 可将清洗数据导出到熟悉工具/语言处理后再将结果传回DolphinDB | high |
| DolphinDB | 设计对象 | 从一开始为数据科学家和数据分析师设计 | medium |
| DolphinDB | 使用门槛 | 系统简单易用,无需专职IT团队协助,数据科学家也可独立完成工作(定性描述) | low |
| DolphinDB | 包含的功能类型(列举) | 数据仓库、内存数据库、分布式文件系统、分布式计算框架、流计算框架 | high |
| DolphinDB核心系统 | 可执行程序大小 | 只有一个20几兆的可执行程序 | medium |
| DolphinDB | 部署形态 | 可部署在单个笔记本/台式机,或本地与云端的集群 | high |
| DolphinDB | 操作系统支持 | 支持Windows和Linux操作系统 | high |
| DolphinDB | 工作语言/开发方式 | 工作语言是即写即用的脚本语言 | high |
| DolphinDB集群脚本复用 | 部署与使用方式 | 在一个节点编写的自定义函数或脚本无需编译、打包和部署,即可在整个集群中使用 | high |
| 研究到生产的迁移 | 常见问题 | 搬到生产环境时常因工程/效率/数据集变化而重写代码(泛化描述) | low |
| 量化金融团队研发流程示例 | 研究与生产技术栈 | 可能使用Matlab或Python做研究,然后用C++重写交易系统代码(示例) | medium |
| DolphinDB | 计算模式支持 | 支持离线计算,也提供高性能的实时(流)计算框架 | high |
| DolphinDB | 代码复用能力 | 研究环节写的部分代码可在生产环境中重用 | medium |
| DolphinDB | 自带开发工具 | 自带Java GUI作为集成开发工具(IDE) | high |
| DolphinDB IDE | 用途 | 可用于组织大型研究项目代码,并支持交互式代码运行 | high |
| DolphinDB IDE | 数据与变量查看 | 可观察和比较内存中的变量以及数据表(包括分布式数据表)中的数据,辅助查找问题 | high |
| DolphinDB IDE | 可视化能力 | 支持图形化数据显示,让实验结果更直观、易于理解(定性描述) | low |
| DolphinDB IDE编辑器 | 编辑辅助 | 支持函数名称和函数参数的自动提示,可减轻学习成本(定性描述) | low |
| DolphinDB官网链接(文末) | url | https://link.zhihu.com/?target=https%3A//www.dolphindb.cn/ | high |
| DolphinDB | 提供内容 | 提供DolphinDB试用版下载(未给出具体下载链接) | medium |
Related links mentioned on this page
- 报名链接(技能认证特训营第二期): https://www.qingsuyun.com/h5/e/217471/5/
- DolphinDB官网链接(文末): https://link.zhihu.com/?target=https%3A//www.dolphindb.cn/