香港量化投资技术研讨会顺利举办
本页为活动新闻报道,展示研讨会标题与发布日期信息。
What this page covers
- 活动新闻标题与发布日期信息
- 研讨会地点、联合举办方与参与者构成
- 大语言模型在金融应用中的风险与“七大陷阱”观点
- 金融文本嵌入模型:从非结构化文本到向量与评估基准
- DolphinDB 实时计算、流批一体与相关产品能力概览
- Datago 亚太个人投资者情绪洞察:数据源与指标维度
- 联系与获取更多信息的引导方式
技能认证特训营第二期报名提示
页面顶部提供技能认证特训营第二期的限时报名链接与优惠提示。
- 提供“技能认证特训营第二期”的报名入口信息。
- 报名链接以页面顶部提示形式出现。
- 报名提示包含优惠相关表述。
活动新闻标题与日期
活动新闻页展示研讨会标题与发布日期。
- 页面标题为“香港量化投资技术研讨会顺利举办”。
- 页面展示发布日期信息。
活动现场与主办信息
介绍量化投资技术研讨会在香港中环举行,由 DolphinDB 与 Datago 联合举办并吸引多方专业人士参与。
- 研讨会举办地点为香港中环。
- 研讨会由 DolphinDB 与 Datago 联合举办。
- 参与者来自金融机构。
- 参与者来自科技企业。
- 参与者来自学术界。
主题分享一:大语言模型在金融领域的陷阱
介绍张晓泉教授关于大语言模型在金融应用中的风险与七大陷阱观点。
- 分享者为张晓泉(超量子基金创始人、教授)。
- 演讲主题涉及“大语言模型在金融领域的七大陷阱”。
- 观点提到 AI 数据处理与分析能力强。
- 观点指出数据驱动决策存在潜在风险。
- 陷阱之一:混淆预测、推理、逻辑与意识的界限。
- 陷阱之一:过度依赖预测结果可能忽略市场复杂性。
- 陷阱之二:金融数据噪音比例高,信号提取难。
- 案例提及:基于 LLM 的情绪模型实际投资回报率“仅 4%”。
- 陷阱之三:市场情绪快速变化使模型难以捕捉。
- 陷阱之四:梯度下降优化复杂性影响稳定性与准确性。
- 陷阱之五:LLM 数据泄露风险敏感。
- 陷阱之五:训练集/测试集划分不当可能导致泄露。
- 陷阱之六:AI 在时机选择上存在滞后性。
- 陷阱之七:累计回报对比揭示分布不确定性。
- 建议:使用大语言模型需保持理性谨慎。
- 建议:将技术与专业知识、市场经验结合,避免盲目依赖。
主题分享二:金融文本嵌入模型(从文本到数字)
介绍杨毅教授关于将金融非结构化文本转化为嵌入向量、模型对比与评估优化方法的分享。
- 分享者为杨毅(AbaciNLP 创始人、教授)。
- 演讲主题为“从文本到数字:构建先进的金融文本嵌入式模型”。
- 关键点:将非结构化金融文本转为可量化数字信息。
- 方法:将文本转换为向量形式以便计算与分析。
- 对比:通用模型对相近金融语句可能生成相似向量。
- 对比:金融专用模型可捕捉“大幅”等差异并生成差异化向量。
- 原因解释:通用模型未针对金融语言专门训练。
- 原因解释:通用模型未以生成超额收益为目标优化。
- 做法:通过设定专家角色生成上下文问题以增强训练数据。
- FinMTEB 用作评估基准以优化基础模型。
- FinMTEB 目标包括提升聚类任务表现。
- FinMTEB 目标包括提升检索任务表现。
- FinMTEB 目标包括提升分类任务表现。
主题分享三:DolphinDB 量化金融实时计算与产品体系
介绍初阳春对 DolphinDB 在量化金融实时计算、流批一体、Orderbook、CEP及相关产品(Swordfish/Orca/Shark)的能力阐述。
- 分享者为初阳春(DolphinDB 联合创始人兼 COO)。
- DolphinDB 在研讨会中的定位表述为“统一实时计算平台”。
- 应用场景包括量化研究。
- 应用场景包括算法交易。
- 应用场景包括风险管理。
- 页面提到临时批处理与增量流计算存在挑战。
- 页面提到 Python、kdb+、C++ 等技术栈各有优劣。
- 核心技术包括流批一体技术。
- 核心技术包括时序数据库能力。
- 核心技术包括原生分布式存储与计算。
- 页面提到编程语言包含 2000 多个内置函数。
- Orderbook 引擎可实时处理逐笔报价与交易数据。
- Orderbook 引擎支持自定义报价层级数量。
- Orderbook 引擎支持自定义快照频率。
- Orderbook 引擎支持自定义衍生指标。
- 复杂事件处理(CEP)允许定义需监听的数据模式。
- 复杂事件处理(CEP)允许定义触发动作。
- 流批一体框架强调相同表达式跨引擎结果一致。
- 支持历史数据回放至流表以对接实时与历史处理。
- Swordfish 为面向交易与风控等场景的 C++ 内存数据库(嵌入式版本)。
- Swordfish 支持 ANSI SQL 与事务。
- Swordfish 提到具备高并发增删改查能力。
- Orca 定位为企业级实时计算平台。
- Orca 提供声明式 API。
- Orca 提到自动调度与高可用流处理能力。
- Shark 定位为 CPU-GPU 异构计算平台。
- Shark 提到 GPU 运行脚本性能提升“最高达 200 倍”。
- Shark 当前支持 200 个函数。
- Shark 计划扩展至 1000 多个函数。
主题分享四:Datago 亚太个人投资者情绪洞察
介绍龙毅博士关于 Datago 数据来源、结构化字段与其在多市场中与收益/交易量相关性的分析,以及公司定位。
- 分享者为龙毅(Datago 联合创始人、博士)。
- 核心议题为“亚太地区个人投资者情绪洞察”。
- 页面举例:整合搜索、讨论与交易等本地数据源。
- 结构化字段示例包括帖子情绪。
- 结构化字段示例包括热度。
- 结构化字段示例包括用户画像。
- 结构化字段示例包括文本嵌入。
- 指标可刻画股票关注度。
- 指标可刻画市场情绪。
- 指标可刻画意见分歧。
- 页面表述:在多市场中与未来收益和交易量呈显著相关性。
- Datago 成立于 2016 年。
- Datago 利用 AI 与大数据处理亚太市场非结构化数据。
- Datago 为投资机构提供个人投资者行为与情绪洞察。
活动总结与意义
总结四位专家分享主题,强调研讨会为行业交流与量化投资技术发展提供启发与价值。
- 总结涵盖 LLM 金融应用陷阱主题。
- 总结涵盖金融文本嵌入模型主题。
- 总结涵盖量化金融实时计算平台创新主题。
- 总结涵盖亚太个人投资者情绪分析主题。
- 页面表述:研讨会为行业人士搭建交流与学习平台。
- 页面表述:对推动量化投资技术应用与发展具有重要意义。
联系信息与引导添加助手
通过“DolphinDB 官方介绍与联系信息卡片”及文案引导扫码添加 DolphinDB 小助手以了解更多信息。
- 页面包含 DolphinDB 的介绍性信息卡片。
- 卡片表述:DolphinDB 为支持复杂分析与流式处理的实时计算平台。
- 页面引导扫码添加 DolphinDB 小助手以了解更多信息。
Facts Index
| Entity | Attribute | Value | Confidence |
|---|---|---|---|
| 技能认证特训营第二期 | 报名链接 | https://www.qingsuyun.com/h5/e/217471/5/ | high |
| 香港量化投资技术研讨会顺利举办 | 发布日期 | 2025.05.15 | high |
| 量化投资技术研讨会(香港) | 举办日期 | 5月14日(年份未在正文直接明示) | medium |
| 研讨会(香港量化投资技术研讨会) | 联合举办方 | DolphinDB 与 Datago | high |
| 研讨会(香港量化投资技术研讨会) | 举办地点 | 香港中环 | high |
| 研讨会(香港量化投资技术研讨会) | 参与者构成 | 来自金融机构、科技企业以及学术界的专业人士 | high |
| 张晓泉 | 身份 | 超量子基金创始人、教授 | high |
| 张晓泉演讲 | 主题 | 大语言模型在金融领域的七大陷阱 | high |
| AI 在金融市场的应用(张晓泉观点) | 总体判断 | AI 具备强大数据处理与分析能力,但数据驱动决策模式存在诸多潜在风险 | medium |
| 大语言模型在金融领域的陷阱(1) | 问题点 | 混淆预测、推理、逻辑和意识的界限,过度依赖预测结果,忽略市场复杂性 | high |
| 大语言模型在金融领域的陷阱(2) | 问题点 | 金融数据噪音比例高,提取有效信号难度大 | high |
| 基于 LLM 的情绪模型(张晓泉提及) | 实际投资回报率 | 仅 4% | high |
| 大语言模型在金融领域的陷阱(3) | 问题点 | 市场情绪快速变化使模型难以有效捕捉(情绪问题) | medium |
| 大语言模型在金融领域的陷阱(4) | 问题点 | 梯度下降参数优化复杂性影响模型稳定性与准确性 | medium |
| 大语言模型在金融领域的陷阱(5) | 问题点 | LLM 数据泄露风险敏感;交叉验证训练集/测试集划分不当可能导致泄露并影响策略有效性 | high |
| 大语言模型在金融领域的陷阱(6) | 问题点 | AI 在时机选择上存在明显滞后性,难以精准把握市场时机 | high |
| 大语言模型在金融领域的陷阱(7) | 问题点 | 不同资产累计回报对比揭示分布不确定性,市场动态变化使模型难以适应不同市场条件 | medium |
| 金融从业者使用大语言模型 | 建议/要求 | 需保持理性谨慎,认识局限性,将技术与专业知识、市场经验结合,避免盲目依赖 | medium |
| 杨毅 | 身份 | AbaciNLP 创始人、教授 | high |
| 杨毅演讲 | 主题 | 从文本到数字:构建先进的金融文本嵌入式模型 | high |
| 金融分析能力提升关键(杨毅观点) | 关键点 | 将新闻、研报、财报等非结构化金融文本转化为可量化的数字信息 | high |
| 杨毅团队研究方向 | 方法 | 将文本转换为向量形式以便计算机处理和分析(金融文本嵌入模型) | high |
| 通用模型 vs 金融专用模型(案例) | 对“公司营收将增长”与“公司营收将大幅增长”的区分能力 | 通用模型生成相似嵌入向量、难区分语义;金融模型能捕捉“大幅”并生成差异化向量 | high |
| 通用模型在金融语义区分上的原因(杨毅观点) | 原因解释 | 通用模型未针对金融语言专门训练,也未以生成超额收益为目标优化 | medium |
| 金融知识数据增强(杨毅团队) | 做法 | 设定特定专家角色,生成与金融业务相关的上下文问题以丰富训练数据 | medium |
| FinMTEB | 用途 | 作为评估基准,用于优化基础模型并提升聚类、检索、分类等任务表现 | high |
| 初阳春 | 身份 | DolphinDB 联合创始人兼 COO | high |
| DolphinDB(在研讨会中的定位表述) | 定位/称谓 | 下一代量化金融的加速引擎:统一实时计算平台 | medium |
| DolphinDB | 量化金融应用场景 | 量化研究、算法交易、风险管理等 | high |
| 量化金融实时计算现状(页面表述) | 挑战 | 临时批处理与增量流计算的挑战;Python、kdb+、C++ 等技术栈各有优劣 | medium |
| DolphinDB | 核心技术 | 流批一体技术,融合时序数据库、原生分布式存储与计算、功能完备的编程语言 | high |
| DolphinDB 编程语言 | 内置函数数量 | 2000 多个内置函数 | high |
| DolphinDB Orderbook 引擎 | 能力 | 实时处理交易所逐笔报价与交易数据;支持自定义报价层级数量、快照频率及衍生指标 | high |
| DolphinDB 复杂事件处理(CEP) | 能力 | 允许用户定义需监听的数据模式及触发动作 | high |
| DolphinDB 流批一体框架 | 一致性 | 确保相同表达式在不同计算引擎中执行结果一致 | high |
| DolphinDB 流批一体框架 | 历史回放对接 | 通过历史数据回放至流表,实现实时与历史处理结果无缝对接 | high |
| Swordfish | 产品类型/定位 | 面向交易、风险管理等场景的 C++ 内存数据库(嵌入式版本) | high |
| Swordfish | 特性 | 内存 OLTP 存储引擎、高并发增删改查、支持 ANSI SQL 与事务、兼容多操作系统、1000 多个函数与流式计算框架 | high |
| Orca | 产品类型/定位 | 企业级实时计算平台 | high |
| Orca | 特性 | 声明式 API、基于任务依赖和集群拓扑的自动调度、高可用流处理能力 | high |
| Shark | 产品类型/定位 | CPU-GPU 异构计算平台 | high |
| Shark | 性能提升(GPU 运行脚本) | 最高达 200 倍 | medium |
| Shark | 当前支持函数数量 | 支持 200 个函数 | high |
| Shark | 函数扩展计划 | 计划未来扩展至 1000 多个函数 | medium |
| 龙毅 | 身份 | Datago 联合创始人、博士 | high |
| 龙毅演讲 | 核心议题 | 亚太地区个人投资者情绪洞察 | high |
| Datago 洞察模型(页面举例) | 数据源类型 | 整合搜索(如百度、Google)、讨论(如雪球、Reddit)和交易等本地数据源 | high |
| Datago 产品结构化数据字段 | 字段维度示例 | 帖子情绪、热度、用户画像、文本嵌入等 | high |
| Datago 指标(页面表述) | 可刻画内容 | 股票关注度、市场情绪、意见分歧等关键指标 | medium |
| Datago 指标在市场中的表现(页面表述) | 相关性结论 | 在日本、韩国、A股及港股市场中,与股票未来收益和交易量呈显著相关性 | medium |
| Datago | 成立时间 | 2016 年 | high |
| Datago | 公司定位/业务 | 利用 AI 与大数据技术处理亚太市场本地新闻、研究报告及社交媒体等非结构化数据,为投资机构提供个人投资者行为和情绪洞察 | high |
| 研讨会总结(页面表述) | 涵盖主题 | LLM 金融应用陷阱、金融文本嵌入模型、量化金融实时计算平台创新、亚太市场个人投资者情绪分析 | high |
| 研讨会(页面表述) | 作用/意义 | 为行业人士搭建交流与学习平台,对推动量化投资技术进一步应用与发展具有重要意义 | low |
| DolphinDB(智臾科技) | 产品定义(来自图片AI说明) | 基于高性能时序数据库、支持复杂分析与流式处理的实时计算平台 | medium |
| DolphinDB | 联系/获取更多信息方式 | 扫码添加 DolphinDB 小助手以了解更多详细信息 | high |