\newcommand{\R}{\mathbb{R}} \newcommand{\E}{\mathbb{E}} \newcommand{\x}{\mathbf{x}} \newcommand{\y}{\mathbf{y}} \newcommand{\wv}{\mathbf{w}} \newcommand{\av}{\mathbf{\alpha}} \newcommand{\bv}{\mathbf{b}} \newcommand{\N}{\mathbb{N}} \newcommand{\id}{\mathbf{I}} \newcommand{\ind}{\mathbf{1}} \newcommand{\0}{\mathbf{0}} \newcommand{\unit}{\mathbf{e}} \newcommand{\one}{\mathbf{1}} \newcommand{\zero}{\mathbf{0}} \newcommand\rfrac[2]{^{#1}!/_{#2}} \newcommand{\norm}[1]{\left\lVert#1\right\rVert}

MinMax缩放器

描述

最小值缩放器缩放给定的数据集,以便所有值都位于用户指定的范围[min,max]之间。如果用户没有为缩放范围提供特定的最小值和最大值,则MinMax缩放器将根据输入数据集的特征转换为位于[0,1]区间。给定一组输入数据$x_1, x_2,…x_n$,最小值:

最大值:

缩放后的数据集$z_1, z_2,…,z_n$为:

当$\textit{min}$和$\textit{max}$是用户指定的要缩放范围的最小值和最大值。

操作

MinMaxScaler是一个Transformer。因此,它支持拟合和变换操作。

拟合

MinMaxScaler针对’Vector’或’LabeledVector’的所有子类型进行训练:

  • fit[T <: Vector]: DataSet[T] => Unit
  • fit: DataSet[LabeledVector] => Unit

转换

MinMaxScaler将’Vector’或’LabeledVector’的所有子类型转换为各自的类型:

  • transform[T <: Vector]: DataSet[T] => DataSet[T]
  • transform: DataSet[LabeledVector] => DataSet[LabeledVector]

参数

MinMax缩放器的实现受到下面两个参数的控制

参数 描述
Min 缩放数据集的范围的最小值。 (默认值: 0.0)
Max 缩放数据集的范围的最大值。 (默认值: 1.0)

例子

  1. // Create MinMax scaler transformer val minMaxscaler = MinMaxScaler()
  2. .setMin(-1.0)
  3. // Obtain data set to be scaled val dataSet: DataSet[Vector] = ...
  4. // Learn the minimum and maximum values of the training data minMaxscaler.fit(dataSet)
  5. // Scale the provided data set to have min=-1.0 and max=1.0 val scaledDS = minMaxscaler.transform(dataSet)