oneHot
New in version 1.30.15.
语法
oneHot(obj, encodingColumns)
参数
obj 是一个内存表。
encodingColumns 是一个字符串或者字符串向量,指定用于编码的列名。
详情
对内存表的指定列进行独热编码(one-hot),返回编码后的表,列的顺序为编码列,非编码列。其中,编码列的列名格式为:原字段名_值。
例子
$ t = table( take(`Tom`Lily`Jim, 10) as name, take(true false, 10) as gender, take(21..23,10) as age);
$ oneHot(t, `name`gender);
name_Tom |
name_Lily |
name_Jim |
gender_1 |
gender_0 |
age |
---|---|---|---|---|---|
1 |
0 |
0 |
1 |
0 |
21 |
0 |
1 |
0 |
0 |
1 |
22 |
0 |
0 |
1 |
1 |
0 |
23 |
1 |
0 |
0 |
0 |
1 |
21 |
0 |
1 |
0 |
1 |
0 |
22 |
0 |
0 |
1 |
0 |
1 |
23 |
1 |
0 |
0 |
1 |
0 |
21 |
0 |
1 |
0 |
0 |
1 |
22 |
0 |
0 |
1 |
1 |
0 |
23 |
1 |
0 |
0 |
0 |
1 |
21 |