矩阵

DolphinDB 矩阵中的每一列都是一维数组。矩阵中行和列的下标都是从0开始。

创建矩阵

用函数 matrix 创建一个矩阵

// 创建一个整数矩阵，所有值都设为默认值0。
$ matrix(INT, 2, 3);

#0	#1	#2
0	0	0
0	0	0

// 创建一个 SYMBOL 矩阵，所有值都设为默认值 NULL
$ matrix(SYMBOL, 2, 3);

#0	#1	#2

函数 matrix 可以创建包含向量、矩阵、表、元组及这些数据组合的混合数据的矩阵。

$ matrix(1 2 3);

#0
1
2
3

$ matrix([1],[2])

#0	#1
1	2

$ matrix(1 2 3, 4 5 6);

#0	#1
1	4
2	5
3	6

$ matrix(table(1 2 3 as id, 4 5 6 as value));

#0	#1
1	4
2	5
3	6

$ matrix([1 2 3, 4 5 6]);

#0	#1
1	4
2	5
3	6

$ matrix([1 2 3, 4 5 6], 7 8 9);

#0	#1	#2
1	4	7
2	5	8
3	6	9

$ matrix([1 2 3, 4 5 6], 7 8 9, table(0.5 0.6 0.7 as id), 1..9$3:3);

#0	#1	#2	#3	#4	#5	#6
1	4	7	0.5	1	4	7
2	5	8	0.6	2	5	8
3	6	9	0.7	3	6	9

语句X $ m:n或者函数 cast(X, m:n) 把一个向量X转换为一个m×n的矩阵。

$ m=1..10$5:2;
$ m;

#0	#1
1	6
2	7
3	8
4	9
5	10

$ cast(m,2:5);

#0	#1	#2	#3	#4
1	3	5	7	9
2	4	6	8	10

用函数 setIndexedMatrix! 可以将矩阵的行与列标签设为索引，即生成一个索引矩阵。

$ m = matrix(1..5, 6..10);
$ m.rename!(2021.01.01..2021.01.05, `A`B);
$ m.setIndexedMatrix!();

label	A	B
2021.01.01	1	6
2021.01.02	2	7
2021.01.03	3	8
2021.01.04	4	9
2021.01.05	5	10

函数 indexedSeries 创建一个索引序列，可以视为特殊的矩阵。

$ m = indexedSeries(2012.01.01..2012.01.04, [10, 20, 30, 40]);
$ m;

label	col1
2012.01.01	10
2012.01.02	20
2012.01.03	30
2012.01.04	40

DolphinDB 是列式数据库系统，在内存中以列为单位连续储存数据。DolphinDB 从左向右以列为单位填充矩阵中的元素。

使用 rename! 函数给矩阵增加行标签和列标签。

$ m1=1..9$3:3;
$ m1;

#0	#1	#2
1	4	7
2	5	8
3	6	9

$ m1.rename!(`col1`col2`col3);

col1	col2	col3
1	4	7
2	5	8
3	6	9

$ m1.rename!(1 2 3, `c1`c2`c3);


1	1	4	7
2	2	5	8
3	3	6	9

$ m1.colNames();
["c1","c2","c3"]

$ m1.rowNames();
[1,2,3]

重新排列矩阵

用函数 reshape 或 flatten 把一个矩阵转换为一个向量。

$ m1=1..6$3:2;
$ m2 = m1$2:3;
$ m2;

#0	#1	#2
1	3	5
2	4	6

$ m=(1..6).reshape(3:2);
$ m;

#0	#1
1	4
2	5
3	6

$ y=m.reshape()
$ y;
[1,2,3,4,5,6]

$ flatten m;
[1,2,3,4,5,6]

访问矩阵

检查维度 ( shape)，行数( rows)和列数 ( cols)：

$ m=1..10$2:5;
$ shape m;
2 : 5

$ rows m
2
$ cols m
5

有两种获得某个单元格的值的方式：m.cell(row, col) 和 m[row, col]。

$ m=1..12$4:3;
$ m;

#0	#1	#2
1	5	9
2	6	10
3	7	11
4	8	12

$ m[1,2];
10

$ m.cell(1,2);
10

有两种取得某一列的值的方式：第一种是 m.col(index)，其中 index 可以是数据对或者标量；第二种是 m[index] 或 m[, index]，其中 index 可以是标量、数据对或者是向量。

$ m=1..12$4:3;
$ m;

#0	#1	#2
1	5	9
2	6	10
3	7	11
4	8	12

$ m[1];
[5,6,7,8]
// 选出第1列生成一个向量。

$ m[,1];
// 选出第1列生成一个子矩阵。

#0
5
6
7
8

$ m.col(2);
[9,10,11,12]
// 选出第2列。

$ m[2:0];
// 选出第0,1列。

#0	#1
5	1
6	2
7	3
8	4

$ m[1:3];
// 选出第1,2列。

#0	#1
5	9
6	10
7	11
8	12

$ m[0 2];
//选出第0列和第2列。

#0	#1
1	9
2	10
3	11
4	12

有两种取得某一行的值的方式：第一种是 m.row(index) ，其中 index 可以是数据对或者标量；第二种是 m[index, ]，其中 index 可以是标量、数据对或者是向量。

$ m=1..12$3:4;
$ m;

#0	#1	#2	#3
1	4	7	10
2	5	8	11
3	6	9	12

$ m[0,];
// 返回第0行，类型为矩阵。

#0	#1	#2	#3
1	4	7	10

$ flatten(m[0,]);
// 用 flatten 函数将一个矩阵转化为向量。
[1,4,7,10]

$ m.row(2);
// 选出第2行。
[3,6,9,12]

$ m[1:3, ];
// 选出第1,2行。

#0	#1	#2	#3
2	5	8	11
3	6	9	12

$ m[3:1, ];
// 选出第2,1行。

#0	#1	#2	#3
3	6	9	12
2	5	8	11

$ m[0 2,0..3];
//选出第0行和第2行。

#0	#1	#2	#3
1	4	7	10
3	6	9	12

有两种取得子矩阵的方式：第一种是 m.slice(rowIndex,colIndex) 或 m[rowIndex,colIndex]，其中collndex 和 rowIndex 是标量、向量或数据对。如果 colIndex 和 rowIndex 是数据对，那么上限边界值不包含在内。

$ m=1..12$3:4;
$ m;

#0	#1	#2	#3
1	4	7	10
2	5	8	11
3	6	9	12

$ m.slice(0:2,1:3);

#0	#1
4	7
5	8

$ m[1:3,0:2];
// 选出第1,2行，第0,1列。

#0	#1
2	5
3	6

$ m[1:3,2:0];
// 选出第1,2行，第1,0列

#0	#1
5	2
6	3

$ m[3:1,2:0];
// 选出第2,1行，第1,0列

#0	#1
6	3
5	2

$ m[0 2,1 3];
//选出第0,2行，第1,3列

#0	#1
4	10
6	12

$ m[2 1,1 3];
//选出第2,1行，第1,3列

#0	#1
6	12
5	11

修改矩阵

当我们追加一个向量到矩阵时，向量的长度必须是矩阵行数的倍数。

$ m=1..6$2:3;
$ m;

#0	#1	#2
1	3	5
2	4	6

$ append!(m, 7 9);

#0	#1	#2	#3
1	3	5	7
2	4	6	9

$ append!(m, 8 6 1 2);
// 追加2列到m

#0	#1	#2	#3	#4	#5
1	3	5	7	8	1
2	4	6	9	6	2

$ append!(m, 3 4 5);
// 要追加的向量长度必须能被矩阵的行数除尽。

2.00.4及之后的版本，支持使用 m[condition]=X 来修改某些符合条件的值。condition 是一个同 m 具有相同维度的布尔矩阵。X 是一个标量或向量，当 X 是向量时，长度必须与 condition 中 true 值的个数相同。

$ a = 1..12$3:4
$ a[a<5]=5

#0	#1	#2	#3
5	5	7	10
5	5	8	11
5	6	9	12

使用 m[index]=X 来修改某一列，X 是一个标量或者向量。

$ t1=1..50$10:5;
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
2	12	22	32	42
3	13	23	33	43
4	14	24	34	44
5	15	25	35	45
6	16	26	36	46
7	17	27	37	47
8	18	28	38	48
9	19	29	39	49
10	20	30	40	50

$ t1[1]=200;
// 给第1列赋值200
$ t1;

#0	#1	#2	#3	#4
1	200	21	31	41
2	200	22	32	42
3	200	23	33	43
…

$ t1[1]+=200;
// 给第1列加200
$ t1;

#0	#1	#2	#3	#4
1	400	21	31	41
2	400	22	32	42
3	400	23	33	43
…

$ t1[1]=31..40;
// 将31..40的序列追加到第1列
$ t1;

#0	#1	#2	#3	#4
1	31	21	31	41
2	32	22	32	42
3	33	23	33	43
…

使用 m[index] = X 来修改多个列，其中 index 是向量，X 是一个标量或者向量。

$ t1=1..20$4:5;
$ t1;

#0	#1	#2	#3	#4
1	5	9	13	17
2	6	10	14	18
3	7	11	15	19
4	8	12	16	20

$ t1[0 2 4]=101..112;
// 将序列101..112 赋值给第0,2,4列
$ t1;

#0	#1	#2	#3	#4
101	5	105	13	109
102	6	106	14	110
103	7	107	15	111
104	8	108	16	112
…

$ t1[4 2 0]=101..112;
// 将序列101..112赋值给第4,2,0列
$ t1;

#0	#1	#2	#3	#4
109	5	105	13	101
110	6	106	14	102
111	7	107	15	103
112	8	108	16	104
…

$ t1[4 2 0]+=100;
// 第4,2,0列的每个元素加100
$ t1;

#0	#1	#2	#3	#4
209	5	205	13	201
210	6	206	14	202
211	7	207	15	203
212	8	208	16	204
…

使用 m[start:end] = X 来修改多个列，X 是一个标量或者向量。

$ t1=1..50$10:5;
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
2	12	22	32	42
3	13	23	33	43
4	14	24	34	44
5	15	25	35	45
6	16	26	36	46
7	17	27	37	47
8	18	28	38	48
9	19	29	39	49
10	20	30	40	50

$ t1[1:4]=101..130;
// 追加向量101..130到第1,2,3列
$ t1;

#0	#1	#2	#3	#4
1	101	111	121	41
2	102	112	122	42
3	103	113	123	43
…

$ t1[4:1]=101..130;
// 追加向量101..130到第3,2,1列
$ t1;

#0	#1	#2	#3	#4
1	121	111	101	41
2	122	112	102	42
3	123	113	103	43
…

$ t1[4:1]+=100;
// 第3,2,1列的每个元素加100
$ t1;

#0	#1	#2	#3	#4
1	221	211	201	41
2	222	212	202	42
3	223	213	203	43
…

使用 m[index,] = X 修改某行，X 是一个标量或者向量。

$ t1=1..50$10:5;
// 赋值100到第1行

$ t1[1,]=100;
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
100	100	100	100	100
3	13	23	33	43
…

$ t1[1,]+=100;
// 给第1行加100
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
200	200	200	200	200
3	13	23	33	43
…

使用 m[start:end,] = X 修改多行，X 是一个标量或者向量。

$ t1=1..50$10:5;

$ t1[1:4,]=101..115;
// 将序列101..115赋值给第1,2,3行
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
101	104	107	110	113
102	105	108	111	114
103	106	109	112	115
…

$ t1[4:1, ]=101..115;
// 将序列101..115赋值给第3,2,1行
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
103	106	109	112	115
102	105	108	111	114
101	104	107	110	113
…

使用 m[r1:r2, c1:c2] = X 来修改矩阵窗口，X 是一个标量或者向量。

$ t1=1..50$5:10;
$ t1[1:3,5:10]=101..110;
// 将序列101..110赋值给矩阵的第1,2行和第5~9列的窗口
$ t1;

#0	#1	#2	#3	#4	#5	#6	#7	#8	#9
1	6	11	16	21	26	31	36	41	46
2	7	12	17	22	101	103	105	107	109
3	8	13	18	23	102	104	106	108	110
4	9	14	19	24	29	34	39	44	49
5	10	15	20	25	30	35	40	45	50

$ t1=1..50$10:5;
$ t1[5:10, 3:1]=101..110;
// 将序列101..110赋值给矩阵的第5~9行和第2~1列的窗口
$ t1;

#0	#1	#2	#3	#4
…
6	106	101	36	46
7	107	102	37	47
8	108	103	38	48
9	109	104	39	49
10	110	105	40	50

$ t1[10:5, 1:3]+=10;
// 给矩阵的第9~5行，第1~2列加10
$ t1;

#0	#1	#2	#3	#4
1	11	21	31	41
2	12	22	32	42
3	13	23	33	43
4	14	24	34	44
5	15	25	35	45
6	116	111	36	46
7	117	112	37	47
8	118	113	38	48
9	119	114	39	49
10	120	115	40	50

使用m[rowIndex,colIndex] = X 来修改多个单元格，其中 rowIndex 和 colIndex 可以是标量或者向量，X 是一个标量或者向量。

$ t1=1..20$4:5
$ t1[0 2, 0 2]=101;

$ t1;

#0	#1	#2	#3	#4
101	5	101	13	17
2	6	10	14	18
101	7	101	15	19
4	8	12	16	20

$ t1[2 0, 2 0]=1001..1004;
$ t1;

#0	#1	#2	#3	#4
1004	5	1002	13	17
2	6	10	14	18
1003	7	1001	15	19
4	8	12	16	20

按列对矩阵进行过滤

可以使用 lambda 表达式对矩阵的每一个列进行过滤。注意，按列对矩阵进行过滤时，lambda 表达式只能接受一个参数，并且返回的结果必须是 BOOL 类型的标量。

$ m=matrix(0 2 3 4,0 0 0 0,4 7 8 2);
$ m[x->!all(x==0)];
//返回矩阵中不全为0的列

#0	#1
0	4
2	7
3	8
4	2

$ m=matrix(0 2 3 4,5 3 6 9,4 7 8 2);
$ m[def (x):avg(x)>4];
//返回矩阵中均值大于4的列

#0	#1
5	4
3	7
6	8
9	2

对矩阵进行操作

矩阵和标量的操作：

$ m=1..10$5:2;
$ m;

#0	#1
1	6
2	7
3	8
4	9
5	10

$ 2.1*m;
// 给矩阵中的每个元素乘2.1

#0	#1
2.1	12.6
4.2	14.7
6.3	16.8
8.4	18.9
10.5	21

$ m\2;

#0	#1
0.5	3
1	3.5
1.5	4
2	4.5
2.5	5

$ m+1.1;

#0	#1
2.1	7.1
3.1	8.1
4.1	9.1
5.1	10.1
6.1	11.1

$ m*NULL;
// 结果是一个NULL INT的矩阵。

#0	#1

矩阵与向量的操作：

$ m=matrix(1 2 3, 4 5 6);
$ m;

#0	#1
1	4
2	5
3	6

$ m + 10 20 30;

#0	#1
11	14
22	25
33	36

$ m * 10 20 30;

#0	#1
10	40
40	100
90	180

矩阵之间的操作：

$ m1=1..10$2:5
$ m2=11..20$2:5;

$ m1+m2;
// 元素逐个相加

#0	#1	#2	#3	#4
12	16	20	24	28
14	18	22	26	30

$ m1-m2;
// 元素逐个相减

#0	#1	#2	#3	#4
-10	-10	-10	-10	-10
-10	-10	-10	-10	-10

$ m1*m2;
// 元素逐个相乘

#0	#1	#2	#3	#4
11	39	75	119	171
24	56	96	144	200

// 转换矩阵m2
$ m2 = transpose(m2);
// 矩阵相乘
$ m1**m2;

#0	#1
415	440
490	520

用函数处理矩阵

矩阵是一个特殊的向量，所以大部分向量的函数都适用于矩阵。

$ m=1..6$2:3;
$ m;

#0	#1	#2
1	3	5
2	4	6

// 每列的平均值
$ avg(m);
[1.5,3.5,5.5]


// 每列的总和
$ sum(m);
[3,7,11]

// 每个元素的余弦值
$ cos m;

#0	#1	#2
0.540302	-0.989992	0.283662
-0.416147	-0.653644	0.96017

亦可用高阶函数 each 来计算每一个列的平均值。

与矩阵相关的函数

矩阵专用函数有 transpose, inverse(inv), det, diag 和 solve 等。

$ m=1..4$2:2;
$ transpose m;

#0	#1
1	2
3	4

$ inv(m);

#0	#1
-2	1.5
1	-0.5

$ det(m);
-2

// solving m*x=[1,2]
$ m.solve(1 2);
[1,0]

$ y=(1 0)$2:1;
$ y;

#0
1
0

$ m**y;

#0
1
2

$ diag(1 2 3);

#0	#1	#2
1	0	0
0	2	0
0	0	3