DeepSeek vs GPT:DolphinDB 代码能力测试

本页是一篇对比 DeepSeek-R1 与 GPT-4 在 DolphinDB 技术问题(如 SQL、函数与脚本)上的解题与纠错表现的文章,并包含作者与发布日期信息。

Source: https://dolphindb.cn/blogs/151

What this page covers

技能认证特训营第二期报名推广

页面顶部提供限时报名活动与福利优惠入口。

DeepSeek vs GPT:DolphinDB 代码能力测试(标题与作者日期)

该部分呈现文章标题以及作者与发布日期信息。

测试背景与评测目标

该部分说明复杂业务逻辑下查资料与试错成本高,并提出用典型问题对比两大模型的代码能力。

Q1 最近5日资金和(SQL)对比与纠错

围绕“每条记录最近5日资金和”的 DolphinDB SQL 场景,对比两模型的初次回答与修正结果。

Q2 32个行业占比列筛选(多列条件)对比

围绕“32个行业占比均小于50%”的筛选任务,对比两模型给出的方案类型、可行性与语法问题。

Q3 类 Python 双冒号切片(步长取样)对比与二次纠错

围绕步长取样需求,对比两模型的错误来源,以及纠错后仍存在的问题。

Q4 寻找最接近目标值(向量最小距离)对比

以 Python 示例引出 DolphinDB 脚本实现“最接近值”的需求,对比两模型在函数选择上的正确性。

结论:模型幻觉共性、DeepSeek适配性更优与使用建议

该部分总结两模型都可能输出无效函数/语法,并给出综合判断与使用建议。

后续:基于 DeepSeek 开发 DolphinDB 编程辅助大模型与入群方式

该部分披露研发方向,并提供反馈与入群联系信息。

Facts Index

Entity Attribute Value Confidence
技能认证特训营第二期 报名入口 提供“限时报名”链接:https://www.qingsuyun.com/h5/e/217471/5/ ,并宣称享专属福利优惠 high
文章作者 署名 momo high
文章发布日期 date 2025-02-20 high
开发者解决复杂业务逻辑问题的现状 痛点描述 官方文档和案例完善但复杂业务逻辑仍需在碎片化材料中反复试错,耗费大量时间 medium
对比测试设置 题目来源 从技术交流群和 AskDolphinDB 社区提炼典型问题 high
对比模型 参与者 GPT-4 与 DeepSeek-R1 high
对比维度 评测内容 对比代码生成、语法修正等表现,并逐行解析代码以客观呈现 medium
Q1 需求 问题描述 原始表包含 date, code, name, zj(资金)四列;查询记录中最近5日资金和;在 DolphinDB 中用 SQL 写脚本 high
Q1 DeepSeek 解法(图片说明) 实现方式描述 DeepSeek 使用 msum 函数配合 context by 子句,实现每条记录的滑动窗口计算 medium
Q1 GPT-4 初次回答问题(图片说明) 错误点描述 GPT-4 初始使用 group by,导致每个分组仅返回一条结果,未满足对每一条记录都进行计算的需求 medium
Q1 DeepSeek 结论(正文) 可行性评价 DeepSeek 给出的答案可行 medium
Q1 GPT-4 纠错后方案(图片说明) 实现方式描述 GPT-4 改用窗口函数语法:sum() + OVER 子句,partition by 分组、order by 日期排序、rows between 定义窗口范围,以实现每条记录最近5天资金总和 medium
Q1 GPT-4 修正后结果(正文) 可用性评价 修正后得到的代码可以满足需求 medium
Q2 需求 问题描述 数据表33列:产品代码 + 32个行业占比数据;筛选32个行业每个行业占比均小于50%的行 high
Q2 DeepSeek 解法类型(图片说明) 方案范围 DeepSeek 提供三种解法:rowAnd 结合高阶函数、元编程构建 SQL、矩阵操作 medium
Q2 GPT-4 解法类型(图片说明) 方案范围 GPT-4 给出手动罗列条件的 SQL 和元编程思路 medium
Q2 DeepSeek 方法一(正文评价) 适用范围限制 方法一正确,但仅适用于内存表计算 medium
Q2 DeepSeek 方法二(正文评价) 问题点 方法二思路可借鉴,但元编程用法有误,且 reduce 合并条件不如 rowAnd 直接 medium
Q2 DeepSeek 方法三(正文评价) 适用范围限制 方法三与方法一类似,只适用于内存表计算 medium
Q2 GPT-4 方法一(正文评价) 可行性问题 方法一正确,但可行性较差,SQL 写起来非常复杂 medium
Q2 GPT-4 方法二(正文评价) 示例代码问题 元编程思路正确,但示例代码不正确 medium
Q3 需求 问题描述 实现类似 Python list 的双冒号切片;给定交易日历向量 a,每20个交易日取一个日期组成新序列(类似 a[::20]) high
Q3 首次回答问题(图片说明) 总体结论 DeepSeek 与 GPT-4 首次回答均受 Python 编程惯性影响,输出不可直接运行的错误代码 medium
Q3 DeepSeek 首次回答(正文/图片说明) 错误点 错误假设 seq 函数支持三个参数;但 seq 不支持三个参数 medium
Q3 GPT-4 首次回答(正文) 错误点 使用了 Python 语法 sequence[start:end:step](非 DolphinDB 语法),并使用了 DolphinDB 中没有的 len 函数 medium
Q3 DeepSeek 纠错后第二次回答(图片说明/正文) 错误点 仍使用了 DolphinDB 中并不存在的 range 函数 medium
Q3 GPT-4 纠错后第二次回答(图片说明/正文) 错误点 方法一使用了 DolphinDB 里没有的 index 函数;方法二使用了 DolphinDB 不支持的 :20 切片语法 medium
Q4 需求 问题描述 参考 Python 代码:在向量 list 中寻找最接近 target_value 的值;询问 DolphinDB 中如何编写脚本 high
Q4 DeepSeek 方案(图片说明/正文) 函数选择与评价 DeepSeek 给出使用 imin 函数的正确脚本,并被评价为一次性给出可行方案 medium
Q4 GPT-4 方案(图片说明/正文) 错误点 GPT-4 使用了不存在的 idxmin 函数;应为 imin 函数 medium
对比测试总体观察 共性问题 两大模型在解答 DolphinDB 技术问题时都存在“幻觉输出”,表现为有时推荐的函数/语法无效 medium
综合结论(模型表现) 适配性评价 DeepSeek-R1 在技术适配性上表现更优,大概率能提供符合 DolphinDB 语法规范的可行方案;GPT-4 需要多次修正才能接近正确答案 low
使用 AI 辅助 DolphinDB 编程的原则 建议 必须把握“AI 辅助 + 人工验证”;将 AI 回答作为思路启发而非权威来源;结合 DolphinDB 官方文档核查函数命名、语法结构并验证执行逻辑贴合场景 medium
研发方向披露 正在进行的工作 研发小伙伴正基于 DeepSeek 开发辅助 DolphinDB 编程的大模型 medium
加入技术群方式 微信 dolphindb1 high
反馈渠道 方式 欢迎在评论区留言,或添加小助手微信加入技术群,一起聊需求 high