https://zh.wikipedia.org/wiki/%E5%9F%BA%E6%95%B0%E6%8E%92%E5%BA%8F

1. 简介

  • 基数排序是一种非比较型整数排序算法,
  • 其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。
  • 由于整数也可以表达字符串(比如名字或日期)和特定格式的浮点数,所以基数排序也不是只能使用于整数。

基数排序的方式可以采用LSD(Least significant digital)或MSD(Most significant digital),LSD的排序方式由键值的最右边开始,而MSD则相反,由键值的最左边开始。

2. 实现

实现思路

  1. 将所有待比较数值(正整数)统一为同样的数位长度,数位较短的数前面补零。
  2. 然后,从最低位开始,依次进行一次排序。
  3. 这样从最低位排序一直到最高位排序完成以后,数列就变成一个有序序列。

wiki基数排序.gif

Java实现

  1. public class RadixSort {
  2. public int[] sort(int[] sourceArray) throws Exception {
  3. // 对 arr 进行拷贝,不改变参数内容
  4. int[] arr = Arrays.copyOf(sourceArray, sourceArray.length);
  5. int maxDigit = getMaxDigit(arr);
  6. return radixSort(arr, maxDigit);
  7. }
  8. //获取最高位数
  9. private int getMaxDigit(int[] arr) {
  10. int maxValue = getMaxValue(arr);
  11. return getNumLenght(maxValue);
  12. }
  13. private int getMaxValue(int[] arr) {
  14. int maxValue = arr[0];
  15. for (int value : arr) {
  16. if (maxValue < value) {
  17. maxValue = value;
  18. }
  19. }
  20. return maxValue;
  21. }
  22. protected int getNumLenght(long num) {
  23. if (num == 0) {
  24. return 1;
  25. }
  26. int lenght = 0;
  27. for (long temp = num; temp != 0; temp /= 10) {
  28. lenght++;
  29. }
  30. return lenght;
  31. }
  32. private int[] radixSort(int[] arr, int maxDigit) {
  33. int mod = 10;
  34. int dev = 1;
  35. for (int i = 0; i < maxDigit; i++, dev *= 10, mod *= 10) {
  36. // 考虑负数的情况,这里扩展一倍队列数,其中 [0-9]对应负数,[10-19]对应正数 (bucket + 10)
  37. int[][] counter = new int[mod * 2][0];
  38. for (int j = 0; j < arr.length; j++) {
  39. int bucket = ((arr[j] % mod) / dev) + mod;
  40. counter[bucket] = arrayAppend(counter[bucket], arr[j]);
  41. }
  42. int pos = 0;
  43. for (int[] bucket : counter) {
  44. for (int value : bucket) {
  45. arr[pos++] = value;
  46. }
  47. }
  48. }
  49. return arr;
  50. }
  51. //自动扩容,并保存数据
  52. private int[] arrayAppend(int[] arr, int value) {
  53. arr = Arrays.copyOf(arr, arr.length + 1);
  54. arr[arr.length - 1] = value;
  55. return arr;
  56. }
  57. }

3. 效率

基数排序的时间复杂度是O(k*n),其中n是排序元素个数,k是数字位数。注意这不是说这个时间复杂度一定优于O(nlogn),k的大小取决于数字位的选择(比如比特位数),和待排序数据所属数据类型的全集的大小;k决定了进行多少轮处理,而n是每轮处理的操作数目。

  • 时间复杂度: O(k*n)
  • 空间复杂度: O(k+n)

基数排序如果想效率比较高, 则对要排序的数据有要求

  • 数据可以用位的用”位”来分割
  • “位”之间有递进关系
  • 每一位的数据范围不能太大,要可以用线性排序算法来排序

如果不能满足这几点, 基数排序就无法使用