在金融科技浪潮席卷全球的当下,量化投资领域正经历着深刻的变革与创新。5月14日,由 DolphinDB 与 Datago 联合举办的量化投资技术研讨会在香港中环盛大举行。此次研讨会吸引了众多来自金融机构、科技企业以及学术界的专业人士,大家齐聚一堂,共同探讨量化投资领域的前沿技术与市场洞察。
超量子基金创始人张晓泉教授以“大语言模型在金融领域的七大陷阱”为主题,指出尽管 AI 在金融市场中展现出强大的数据处理与分析能力,但其数据驱动的决策模式存在诸多潜在风险。
首先,人们对 AI 存在误解,常常混淆预测、推理、逻辑和意识的界限,过度依赖其预测结果而忽略市场的复杂多变性。第二,金融数据中噪音比例高,提取有效信号的难度较大。第三,基于 LLM 的情绪模型在实际投资中回报率仅 4%,凸显了情绪问题,市场情绪的快速变化使得模型难以有效捕捉。第四,梯度下降涉及参数优化的复杂性,影响模型的稳定性和准确性。第五,在金融领域,LLM 数据泄露风险尤为敏感,交叉验证中训练集与测试集划分不当可能导致数据泄露,进而影响交易策略的有效性。第六,AI 在时机选择上存在明显滞后性,难以精准把握市场时机。第七,不同资产的累计回报对比揭示了分布不确定性问题,市场的动态变化使 AI 模型难以适应各种市场条件。
这些陷阱提醒金融从业者,在运用大语言模型时,必须保持理性与谨慎,充分认识其局限性,将技术与专业知识、市场经验相结合,避免盲目依赖技术而陷入风险。
AbaciNLP 创始人杨毅教授,带来了题为“从文本到数字:构建先进的金融文本嵌入式模型”的精彩分享。他指出,金融领域充斥着大量文本信息,如新闻报道、研报、财报等,如何将这些非结构化文本转化为可量化的数字信息,是提升金融分析能力的关键。
杨教授团队专注于金融文本嵌入模型的研究,致力于将文本转换为向量形式,以便计算机进行处理和分析。通过对比通用模型与金融专用模型的性能,杨教授展示了一个实际案例:对于“公司营收将增长”和“公司营收将大幅增长”这两个表述,通用模型无法有效区分其语义差异,生成相似的嵌入向量;而金融模型则能够敏锐捕捉到“大幅”这一关键信息,生成差异化向量,精准反映语义变化。这一差异的根源在于,通用模型未针对金融语言进行专门训练,更未以生成超额收益为目标进行优化。
为进一步提升模型性能,杨教授团队采用金融知识数据增强技术。通过设定特定的专家角色,生成与金融业务紧密相关的上下文问题,从而丰富模型的训练数据。在对比学习与模型融合方面,团队利用 FinMTEB 作为评估基准,对基础模型进行优化,显著提升了模型在聚类、检索、分类等金融文本嵌入任务中的表现。
杨教授的研究为金融文本分析开辟了新的路径,有助于金融机构更精准地挖掘文本数据中的价值,为投资决策提供更科学、准确的依据。
DolphinDB 联合创始人兼 COO 初阳春在研讨会上详细介绍了 DolphinDB 在量化金融领域的创新实践与技术优势,为与会者呈现了下一代量化金融加速引擎的蓝图。
在量化金融领域,DolphinDB 应用场景广泛,涵盖量化研究、算法交易、风险管理等。当前,实时计算在量化金融中面临着临时批处理与增量流计算的挑战,不同技术栈如 Python、kdb+、C++ 各有优劣。DolphinDB 通过“流批一体”技术,融合时序数据库、原生分布式存储与计算,以及功能完备的编程语言和 2000 多个内置函数,实现了高性能的数据处理与分析。
DolphinDB 高性能 Orderbook 引擎能够实时处理交易所逐笔报价与交易数据,用户可根据需求自定义报价层级数量、快照频率及衍生指标。复杂事件处理(CEP)功能允许用户定义需监听的数据模式及触发动作。
值得一提的是,DolphinDB 还推出流批一体框架,确保相同表达式在不同计算引擎中执行结果一致,且通过历史数据回放至流表,实现实时与历史处理结果的无缝对接。此外,针对极低延迟场景,DolphinDB 推出嵌入式版本 Swordfish,这是一款面向交易、风险管理等场景的 C++ 内存数据库,具备内存 OLTP 存储引擎、高并发增删改查、支持 ANSI SQL 与事务、兼容多操作系统以及 1000 多个函数与流式计算框架等特性。
同时,企业级实时计算平台 Orca 具备声明式 API、基于任务依赖和集群拓扑的自动调度以及高可用流处理能力;Shark 则是 CPU-GPU 异构计算平台,在 GPU 上运行 DolphinDB 脚本可使性能提升最高达 200 倍,当前支持 200 个函数,并计划未来扩展至 1000 多个,以满足更复杂的量化金融计算需求。
初阳春的介绍充分展示了 DolphinDB 在量化金融实时计算领域的强大实力和创新能力,为金融机构提升量化投资效率、优化风险管理提供了有力的技术支撑。
Datago 联合创始人龙毅博士在研讨会上深入分析了亚太市场个人投资者的情绪及其对市场的影响,为投资者提供了独特的市场视角。
Datago 的数据来源广泛,能够有效捕捉亚太地区本地个人投资者与消费者的情绪与兴趣。龙毅博士介绍了如何借助 Datago 产品所提供的结构化数据字段——涵盖帖子情绪、热度、用户画像、文本嵌入等多个维度——从多个角度刻画股票的关注度、市场情绪以及意见分歧等关键指标,并进一步展示了这些指标在日本、韩国、A 股及港股市场中,与股票未来收益和交易量之间所呈现出的显著相关性。
自 2016 年成立以来,Datago 始终专注于利用前沿的人工智能(AI)与大数据技术,深入处理亚太市场本地的新闻、研究报告及社交媒体等非结构化数据。从而为投资机构提供对亚太地区个人投资者行为和情绪的全面洞察,助力其更好地把握市场动态,制定更具前瞻性的投资策略。
此次量化投资技术研讨会为行业内人士搭建了一个交流与学习的优质平台,通过四位专家的精彩分享,深入探讨了量化投资领域的前沿技术与市场动态。从大语言模型在金融领域的应用陷阱,到金融文本嵌入模型的构建,从量化金融实时计算平台的创新,到亚太市场个人投资者情绪分析,每一个主题都紧扣行业发展脉搏,为参会者带来了深刻的启发与思考,对推动量化投资技术在金融领域的进一步应用与发展具有重要意义。
扫码添加 DolphinDB 小助手,了解更多详细信息。