\newcommand{\R}{\mathbb{R}} \newcommand{\E}{\mathbb{E}} \newcommand{\x}{\mathbf{x}} \newcommand{\y}{\mathbf{y}} \newcommand{\wv}{\mathbf{w}} \newcommand{\av}{\mathbf{\alpha}} \newcommand{\bv}{\mathbf{b}} \newcommand{\N}{\mathbb{N}} \newcommand{\id}{\mathbf{I}} \newcommand{\ind}{\mathbf{1}} \newcommand{\0}{\mathbf{0}} \newcommand{\unit}{\mathbf{e}} \newcommand{\one}{\mathbf{1}} \newcommand{\zero}{\mathbf{0}} \newcommand\rfrac[2]{^{#1}!/_{#2}} \newcommand{\norm}[1]{\left\lVert#1\right\rVert}
MinMax缩放器
描述
最小值缩放器缩放给定的数据集,以便所有值都位于用户指定的范围[min,max]之间。如果用户没有为缩放范围提供特定的最小值和最大值,则MinMax缩放器将根据输入数据集的特征转换为位于[0,1]区间。给定一组输入数据$x_1, x_2,…x_n$,最小值:
最大值:
缩放后的数据集$z_1, z_2,…,z_n$为:
当$\textit{min}$和$\textit{max}$是用户指定的要缩放范围的最小值和最大值。
操作
MinMaxScaler是一个Transformer。因此,它支持拟合和变换操作。
拟合
MinMaxScaler针对’Vector’或’LabeledVector’的所有子类型进行训练:
fit[T <: Vector]: DataSet[T] => Unit
fit: DataSet[LabeledVector] => Unit
转换
MinMaxScaler将’Vector’或’LabeledVector’的所有子类型转换为各自的类型:
transform[T <: Vector]: DataSet[T] => DataSet[T]
transform: DataSet[LabeledVector] => DataSet[LabeledVector]
参数
MinMax缩放器的实现受到下面两个参数的控制
参数 | 描述 |
---|---|
Min | 缩放数据集的范围的最小值。 (默认值: 0.0) |
Max | 缩放数据集的范围的最大值。 (默认值: 1.0) |
例子
// Create MinMax scaler transformer val minMaxscaler = MinMaxScaler()
.setMin(-1.0)
// Obtain data set to be scaled val dataSet: DataSet[Vector] = ...
// Learn the minimum and maximum values of the training data minMaxscaler.fit(dataSet)
// Scale the provided data set to have min=-1.0 and max=1.0 val scaledDS = minMaxscaler.transform(dataSet)