描述

给定一个正整数数组 w ,其中 w[i] 代表下标 i 的权重(下标从 0 开始),请写一个函数 pickIndex ,它可以随机地获取下标 i,选取下标 i 的概率与 w[i] 成正比。

例如,对于 w = [1, 3],挑选下标 0 的概率为 1 / (1 + 3) = 0.25 (即,25%),而选取下标 1 的概率为 3 / (1 + 3) = 0.75(即,75%)。

也就是说,选取下标 i 的概率为 w[i] / sum(w)

示例

示例 1:

  1. 输入:
  2. inputs = ["Solution","pickIndex"]
  3. inputs = [[[1]],[]]
  4. 输出:
  5. [null,0]
  6. 解释:
  7. Solution solution = new Solution([1]);
  8. solution.pickIndex(); // 返回 0,因为数组中只有一个元素,所以唯一的选择是返回下标 0。

示例 2:

输入:
inputs = ["Solution","pickIndex","pickIndex","pickIndex","pickIndex","pickIndex"]
inputs = [[[1,3]],[],[],[],[],[]]
输出:
[null,1,1,1,1,0]
解释:
Solution solution = new Solution([1, 3]);
solution.pickIndex(); // 返回 1,返回下标 1,返回该下标概率为 3/4 。
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 1
solution.pickIndex(); // 返回 0,返回下标 0,返回该下标概率为 1/4 。

由于这是一个随机问题,允许多个答案,因此下列输出都可以被认为是正确的:
[null,1,1,1,1,0]
[null,1,1,1,1,1]
[null,1,1,1,0,0]
[null,1,1,1,0,1]
[null,1,0,1,0,0]
......
诸若此类。

提示

  • 1 <= w.length <= 10000
  • 1 <= w[i] <= 10^5
  • pickIndex 将被调用不超过 10000

解题思路

前缀和 + 二分查找

  • 我们可以使用「前缀和」数组来作为权重分布序列,权重序列的基本单位为 1。
  • 一个长度为 n 的构造好的「前缀和」数组可以看是一个基本单位为 1 的 [1,sum[n−1]] 数轴。
  • 使用随机函数参数产生 [1,sum[n−1]] 范围内的随机数,通过「二分」前缀和数组即可找到分布位置对应的原始下标值。

代码

class Solution {
    private int total;
    private int[] prev;
    public Solution(int[] w) {
        int len = w.length;
        prev = new int[len];
        for (int i = 0; i < len; i++) {
            total += w[i];
            prev[i] = total;
        }
    }

    public int pickIndex() {
        int target = (int) (Math.random() * total) + 1; //Math.random()是令系统随机选取大于等于 0.0 且小于 1.0 的伪随机 double 值
        int left = 0, right = prev.length;
        while (left < right) {
            int mid = (left + right)/2;
            if (target == prev[mid]) {
                return mid;
            } else if (target < prev[mid]) {
                right = mid;
            } else {
                left = mid + 1;
            }
        }
        return left;
    }
}

复杂度分析

时间复杂度:初始化的时间复杂度为 O(n),每次选择的时间复杂度为 O(logn),其中 n 是数组 w 的长度。
空间复杂度:O(n),即为前缀和数组 pre 需要使用的空间。