新闻

DolphinDB × 香港中文大学(深圳) | 项目实战磨炼因子挖掘硬实力

2026.05.09

“TB级数据秒级响应,因子挖掘效率百倍跃升”——量化金融的技术迭代正以前所未有的速度重塑行业格局。

作为国内领先的高性能时序数据库厂商,DolphinDB 受香港中文大学(深圳)(下称港中深)邀请,于 2025 年 9 月至 2026 年 4 月参与其金融工程硕士课程,共建因子挖掘实战课程设计项目。该项目以 DolphinDB 为核心,覆盖因子挖掘的完整流程,从数据清洗到成果汇报,每一个环节都对标金融机构的真实投研场景。参与课程的同学们在 TB 级真实数据环境中完整走通了因子开发到策略构建的全流程,深入体验了 DolphinDB 在高频场景下的计算效率,收获了量化研究与工程实践的宝贵经验。

项目直击

“这不是传统的课堂,更像一个迷你量化投研部。”参与课程的学生如此评价。

作为港中深金融工程硕士核心课程下的特色合作模块,本次课程设计从数据清洗、数据预处理到因子开发、因子落库与评价,再到回测验证与机器学习模型探索,每一环节都对标金融机构的真实投研场景。

课程设计上,学生从四大前沿方向中自主选题,包括订单簿动态特征因子、交易行为模式因子、量价衍生因子及市场微观结构因子,每组需独立开发50余个关联因子。DolphinDB 为学生提供了沪深股票 Level 2 逐笔成交、委托等真实高频数据集,数据量达 TB 级别,让学生在真实数据环境中体验 DolphinDB 的高效计算能力。

项目推进采用 “自主研究 + 定期辅导” 模式:DolphinDB 技术团队全程参与微信群日常答疑,及时解决学生在数据处理、因子开发中遇到的技术问题;每两周进行一次进度汇报与问题探讨,导师针对性给出指导方向;学期末以答辩形式进行成果验收。项目历时一学年,分为前期数据准备与因子初探、中期答辩、深度开发与模型探索、终期答辩四个阶段,循序渐进地引导学生完成从数据到因子的全流程实战。

项目成果

经过一个学年的实战推进,各小组完整走通了从数据清洗到策略构建的全链路流程,取得了扎实的成果。

50 余个因子开发。各小组累计开发了 50 余个各自研究方向的因子,并完成了因子落库与评价的全流程,从中筛选出表现优异的因子进行深度分析。有小组开发了一套适用于不同类型因子的通用数据清洗框架,将繁琐的数据预处理工作标准化,提升后续研究效率。

机器学习策略落地。部分小组将开发的因子作为特征输入,基于 XGBoost 模型构建了量化交易策略,在回测中取得了较好的收益表现,验证了因子挖掘到策略构建的完整路径。

高频框架突破。有小组自行探索基于逐笔数据合成高频订单簿,将因子分析频率从分钟级推至 tick 级,开发出更高频的因子分析及回测框架,展现了扎实的工程与建模能力。

性能对比验证。有小组采用 DolphinDB 和 Python 分别计算相同因子,进行了系统的性能对比分析,用实测数据验证了 DolphinDB 在高频场景下的计算效率优势,结论与行业认知高度一致。

经过一学年的学习,同学们对 DolphinDB 的掌握和对因子挖掘的理解都有了质的提高。中期答辩时,部分成果已展现初步的实际应用潜力;终期答辩时,各小组的研究深度和成果完整度进一步提升,答辩评委从因子逻辑的创新性、代码实现的规范性、成果的实用价值等多个维度给予了高度评价。

学生反馈:数据说话

一学期的课程落下帷幕,同学们对 DolphinDB 给出了相当积极的评价——

DolphinDB 在高频数据处理效率上,比 Python/pandas、R 这些“老熟人”更强。换句话说,每个人都在项目中真实体会到了“快”字意味着什么。

同学进一步表示,DolphinDB 的 K 线合成和因子回测能力同样令人印象深刻;近七成对内置的丰富金融函数赞不绝口。一位同学在问卷里写道:“最大的收获不是学会了某个工具,而是完整地走了一遍量化研究的全流程。”高频数据处理能力、因子挖掘的系统方法论、把理论落地到真实数据的动手经验——这是大家公认最有价值的东西。

另外,项目结束后许多同学明确表示对 DolphinDB 的实习和考证都感兴趣,想继续往这个方向走下去。能让学生从“学完”到“还想继续”,这大概是对一门实战课最好的认可。

目前,DolphinDB 也在积极推进官方认证体系的建设,未来将为有志于量化金融方向的学生提供系统化的技能认证路径。下一期技能认证特训营也正在筹备中,届时将进一步优化课程设计与项目课题,为更多同学带来更深入的实战体验,欢迎感兴趣的同学后续报名参与。

DolphinDB 蔚蓝计划

为推进高校合作,DolphinDB 已正式启动蔚蓝计划,旨在通过产学研协同创新、人才共育等多种形式,致力于将 DolphinDB 引入高校,共同培养具备国际视野、创新精神和实践能力的高素质金融科技人才。合作内容包括讲座、课程开发、人才实训及联合研究等,为学生提供丰富的学习资源、实习机会及研究课题。

目前,DolphinDB 已与多所知名高校开展合作,包括上海交通大学安泰经济与管理学院、上海交通大学高级金融学院、北京大学经济学院、浙江大学经济学院、中国科学技术大学管理学院、中国人民大学数学学院、上海财经大学实验中心、南方科技大学商学院、对外经济贸易大学、复旦大学、南京大学、北京大学汇丰商学院、香港中文大学(深圳)、暨南大学、中山大学、北师香港浸会大学、华南理工大学、东南大学等。

关于 DolphinDB

由智臾科技研发的高性能分布式时序数据库 DolphinDB,不仅支持海量数据的高效存储与查询,更开创性地提供功能完备的编程语言以支持复杂分析,以及高吞吐、低延时、开发便捷的流数据分析框架,是计算能力最强的数据库系统之一。DolphinDB 显著提升了海量数据分析的效率,并且大幅减少开发成本,使企业能够更加灵活面对瞬息万变的行业竞争。