收下这份白皮书,解锁高性能自动因子挖掘新体验!

本页引导阅读与获取一份关于高性能自动因子挖掘的白皮书,并介绍传统因子挖掘痛点,以及 DolphinDB 的 CPU-GPU 异构平台 Shark 与其应用 Shark GPLearn。

Source: https://dolphindb.cn/blogs/127

What this page covers

技能认证特训营第二期报名推广

本段推广“技能认证特训营第二期”,并提示限时报名与福利优惠,同时给出报名链接。

白皮书引导:高性能自动因子挖掘(Shark GPLearn)

本段引出白皮书主题,概述传统因子挖掘的不足,并介绍 DolphinDB 推出的 CPU-GPU 异构计算平台 Shark 与其自动因子挖掘应用 Shark GPLearn。

白皮书内容范围与获取方式(官网开发者中心-白皮书)

本段说明白皮书覆盖的内容范围,并引导到 DolphinDB 官网的开发者中心白皮书栏目获取完整资料。

白皮书预览:背景介绍(遗传算法与行业实践挑战)

本段预览白皮书背景介绍内容,涉及遗传算法的概念与流程、进化策略,以及金融行业因子挖掘方法与挑战,并给出总体流程图说明。

白皮书预览:基本概念(设计构想、原理与性能对比)

本段预览白皮书的基本概念部分,介绍 Shark GPLearn 的设计构想与工作原理,并提及与传统 Python gplearn 的性能对比。

白皮书预览:架构实现(模块组成与 GPExecutor 流程)

本段预览白皮书的架构实现部分,提到 Shark 的模块划分,以及 Shark GPLearn 的基本架构与 GPExecutor 的执行流程(并配有架构图说明)。

白皮书预览:功能特性

本段列出 Shark GPLearn 的功能特性与优势方向,包括算子库、三维数据因子挖掘、单机多卡与 GPU 性能释放等。

白皮书预览:应用案例(股票日频K线因子挖掘流程)

本段以股票日频 K 线数据为例,预览 Shark GPLearn 的因子挖掘流程步骤,并说明案例包含可参考的代码与调参说明。

白皮书预览:未来规划(适配更多计算卡、扩展算子、支持自定义函数)

本段描述 Shark GPLearn 的未来规划方向,包括适配更多计算卡、扩展算子支持,以及通过脚本语言支持用户自定义函数。

Facts Index

Entity Attribute Value Confidence
技能认证特训营第二期 status 正式开启(限时报名,享专属福利优惠) medium
技能认证特训营第二期 registration_link https://www.qingsuyun.com/h5/e/217471/5/ high
页面文章 publish_date 2024-12-11 high
因子挖掘(传统方法) limitation 计算效率低、无法处理复杂三维数据等不足 medium
Shark positioning DolphinDB 推出的 CPU-GPU 异构计算平台 high
Shark GPLearn description 基于遗传算法的自动因子挖掘(关键应用之一) high
Shark GPLearn benefit 企业可以利用 GPU 大幅提升因子挖掘效率 medium
《Shark GPLearn 高性能因子挖掘白皮书》 scope 全面介绍工作原理、架构实现、功能特性以及应用案例 high
白皮书获取方式 location DolphinDB 官网【开发者中心】-【白皮书】 high
遗传算法(白皮书背景介绍部分) covered_topics 概念、流程、多种进化策略(如交叉变异、子树变异等) high
金融行业因子挖掘实践方法(白皮书背景介绍部分) examples 回归分析、遗传算法等 medium
遗传算法总体流程图(配图说明) process_steps 随机生成初始公式→计算适应度筛选→选择/进化/变异产生新一代→满足迭代次数或适应度要求后输出结果 medium
Shark GPLearn(白皮书基本概念部分) covered_topics 设计构想、工作原理,以及与传统 Python gplearn 挖掘因子的性能对比 high
Shark GPLearn vs Python gplearn(配图说明) performance_claim 在 1 千行到 1000 万行数据规模下均表现出极高计算性能;千万级运行时间缩短至秒级;相较传统方法近百倍性能提升 low
Shark(白皮书架构实现部分) modules 数据转换层和自动因子挖掘 high
Shark GPLearn(白皮书架构实现部分) covered_topics 基本架构与 GPExecutor 的执行流程 high
Shark GPLearn 内部组成(配图说明) components 数据转换层、遗传算法引擎(GPLearnEngine)和计算执行器(GPExecutor) low
Shark GPLearn advantage 拥有更加丰富的算子库 medium
Shark GPLearn capability 支持在三维数据中挖掘因子 medium
Shark GPLearn capability 支持单机多卡挖掘 medium
Shark GPLearn benefit 充分释放 GPU 计算性能 low
Shark GPLearn 应用案例 example_dataset 基于股票日频 K 线数据的因子挖掘 high
Shark GPLearn 因子挖掘流程(应用案例部分) steps 数据清洗→模型训练→因子评价 high
应用案例内容 includes 可供参考的代码和调参说明 medium
Shark GPLearn hardware_support_plan 除支持 NVIDIA 的 GPU 外,将适配更多国产计算卡以满足信创需求并降低用户成本 medium
Shark GPLearn 高性能因子挖掘功能 feature_expansion_plan 扩展对更多数据分析算子的支持 medium
Shark GPLearn extensibility_plan 允许用户通过脚本语言定义更灵活的用户自定义函数 medium