oneHot

New in version 1.30.15.

语法

oneHot(obj, encodingColumns)

参数

obj 是一个内存表。

encodingColumns 是一个字符串或者字符串向量,指定用于编码的列名。

详情

对内存表的指定列进行独热编码(one-hot),返回编码后的表,列的顺序为编码列,非编码列。其中,编码列的列名格式为:原字段名_值。

例子

$ t = table( take(`Tom`Lily`Jim, 10) as name, take(true false, 10) as gender, take(21..23,10) as age);
$ oneHot(t, `name`gender);

name_Tom

name_Lily

name_Jim

gender_1

gender_0

age

1

0

0

1

0

21

0

1

0

0

1

22

0

0

1

1

0

23

1

0

0

0

1

21

0

1

0

1

0

22

0

0

1

0

1

23

1

0

0

1

0

21

0

1

0

0

1

22

0

0

1

1

0

23

1

0

0

0

1

21