根据尚硅谷的韩顺平老师的数据结构视频总结的笔记
观看视频的网址
排序也称排序算法 (Sort Algorithm),排序是将一 组数据,依指定的顺序进行排列的过程。
1) 内部排序:
指将需要处理的所有数据都加载 到内部存储器中进行排序。
2) 外部排序法:
数据量过大,无法全部加载到内 存中,需要借助外部存储进行排序。
3) 常见的排序算法分类(见下图):
1、度量一个程序(算法)执行时间的两种方法
1)事后统计的方法
这种方法可行, 但是有两个问题:一是要想对设计的算法的运行性能进行评测,需要实际运行该程序;二是所得时间的统计量依赖于计算机的硬件、软件等环境因素, 这种方式,要在同一台计算机的相同状态下运行,才能比较那个算法速度更快。
2)事前估算的方法
通过分析某个算法的时间复杂度来判断哪个算法更优.
2、时间频度
一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)
3、时间复杂度
一般情况下,算法中的基本操作语句的重复执行次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n) / f(n) 的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作 T(n)=O( f(n) ),称O( f(n) ) 为算法的渐进时间复杂度,简称时间复杂度。
T(n) 不同,但时间复杂度可能相同。 如:T(n)=n²+7n+6 与 T(n)=3n²+2n+2 它们的T(n) 不同,但时间复杂度相同,都为O(n²)。
计算时间复杂度的方法:
用常数1代替运行时间中的所有加法常数 T(n)=n²+7n+6 => T(n)=n²+7n+1修改后的运行次数函数中,只保留最高阶项 T(n)=n²+7n+1 => T(n) = n²去除最高阶项的系数 T(n) = n² => T(n) = n² => O(n²)
常见的时间复杂度:
常数阶O(1)
对数阶O(log2n)
线性阶O(n)
线性对数阶O(nlog2n)
平方阶O(n^2)
立方阶O(n^3)
k次方阶O(n^k)
指数阶O(2^n)
常见的算法时间复杂度由小到大依次为:Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)< Ο(nk) <Ο(2n) ,随着问题规模n的不断增大,上述时间复杂度不断增大,算法的执行效率越低
4、平均时间复杂度和最坏时间复杂度
1)平均时间复杂度是指所有可能的输入实例均以等概率出现的情况下,该算法的运行时间。
2)最坏情况下的时间复杂度称最坏时间复杂度。一般讨论的时间复杂度均是最坏情况下的时间复杂度。 这样做的原因是:最坏情况下的时间复杂度是算法在任何输入实例上运行时间的界限,这就保证了算法的运行时间不会比最坏情况更长。
3)平均时间复杂度和最坏时间复杂度是否一致,和算法有关
冒泡排序(Bubble Sorting)的基本思想是:通过对待排序序列从前向后(从下标较小的元素开始),依次比较相邻元素的值,若发现逆序则交换,使值较大的元素逐渐从前移向后部,就象水底下的气泡一样逐渐向上冒。
优化:
因为排序的过程中,各元素不断接近自己的位置,如果一趟比较下来没有进行过交换,就说明序列有序,因此要在排序过程中设置一个标志flag判断元素是否进行过交换。从而减少不必要的比较。(这里说的优化,可以在冒泡排序写好后,在进行)
图解演示示例:
代码实现:
package sorting; import java.util.Arrays; /** * @description: 冒泡排序 * @auther:田坤 * @date 2020/10/8 9:35 **/ public class dubbleSorting { public static void main(String[] args) { int[] arr = {43, 13, -2, 98, -4}; //dubble(arr); //测试八万个数据的冒泡排序 O(n^2) int[] arr2 = new int[80000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 dubble(arr2); long end = System.currentTimeMillis(); System.out.println("话费的时间为:"+(end-start)+"ms"); } //冒泡排序 public static void dubble(int[] arr) { boolean flag; //标识, 标识在排序中数据是否交换过 int temp; for (int i = 0; i < arr.length - 1; i++) { flag = false; for(int j = 0 ; j < arr.length -1 -i;j++){ if(arr[j] > arr[j+1]){ temp =arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; flag = true; } } if(!flag) break; //System.out.println("第"+(i+1)+"次排序的结果"+ Arrays.toString(arr)); } } }测试排序八万个数据的结果:
花费的时间为:10389ms
选择式排序也属于内部排序法,是从欲排序的数据中,按指定的规则选出某一元素,再依规定交换位置后达到排序的目的。
基本思想:
选择排序(select sorting)也是一种简单的排序方法。它的基本思想是:第一次从arr[0]~arr[n-1]中选取最小值,与arr[0]交换,第二次从arr[1]~arr[n-1]中选取最小值,与arr[1]交换,第三次从arr[2]~arr[n-1]中选取最小值,与arr[2]交换,…,第i次从arr[i-1]~arr[n-1]中选取最小值,与arr[i-1]交换,…, 第n-1次从arr[n-2]~arr[n-1]中选取最小值,与arr[n-2]交换,总共通过n-1次,得到一个按排序码从小到大排列的有序序列。
选择排序思路的分析图:
代码实现
package sorting; import java.util.Arrays; /** * @description: 选择排序 * @auther:田坤 * @date 2020/10/8 10:24 **/ public class SelectSorting { public static void main(String[] args) { int[] arr = {101,34,119,1}; //select(arr); //测试八万个数据的冒泡排序 O(n^2) int[] arr2 = new int[80000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 select(arr2); long end = System.currentTimeMillis(); System.out.println("话费的时间为:"+(end-start)+"ms"); } //选择排序 public static void select(int[] arr) { /* //使用逐步推导的方式来完成选择排序 //原始数据 101,34,119,1 //算法 先简单——》复杂, 可以把一个复杂的算法,拆分成简单的问题——》逐步解决 //第一轮 int minIndex = 0; int min = arr[0]; for (int j = 0 + 1 ; j < arr.length ; j++){ if(arr[j] < min){ min = arr[j]; minIndex = j; } } if(minIndex != 0){ arr[minIndex] = arr[0]; arr[0] = min; } System.out.println("第一轮选择排序的数组:"+ Arrays.toString(arr)); //第二轮 minIndex = 1; min = arr[1]; for (int j = 1 + 1 ; j < arr.length ; j++){ if(arr[j] < min){ min = arr[j]; minIndex = j; } } if(minIndex != 1){ arr[minIndex] = arr[1]; arr[1] = min; } System.out.println("第二轮选择排序的数组:"+ Arrays.toString(arr)); //第三轮 minIndex = 2; min = arr[2]; for (int j = 2 + 1 ; j < arr.length ; j++){ if(arr[j] < min){ min = arr[j]; minIndex = j; } } if(minIndex != 2){ arr[minIndex] = arr[2]; arr[2] = min; } System.out.println("第三轮选择排序的数组:"+ Arrays.toString(arr));*/ int minIndex; //最小值的索引 int min; //最小值 for (int i = 0; i < arr.length-1; i++) { minIndex = i; min = arr[i]; for (int j = i + 1; j < arr.length; j++) { if (arr[j] < min) { min = arr[j]; minIndex = j; } } if (minIndex != i) { arr[minIndex] = arr[i]; arr[i] = min; } //System.out.println("第"+(i+1)+"轮选择排序的数组:" + Arrays.toString(arr)); } } }测试排序八万个数据的时间:
花费的时间为:2881ms
插入式排序属于内部排序法,是对于欲排序的元素以插入的方式找寻该元素的适当位置,以达到排序的目的。
插入排序的思想:
插入排序(Insertion Sorting)的基本思想是:把n个待排序的元素看成为一个有序表和一个无序表,开始时有序表中只包含一个元素,无序表中包含有n-1个元素,排序过程中每次从无序表中取出第一个元素,把它的排序码依次与有序表元素的排序码进行比较,将它插入到有序表中的适当位置,使之成为新的有序表。
插入排序的思路图:
代码实现:
package sorting; import java.util.Arrays; /** * @description: 插入排序 * @auther:田坤 * @date 2020/10/8 15:06 **/ public class InsertSorting { public static void main(String[] args) { int[] arr = {101,34,109,1}; //insert(arr); //测试八万个数据的冒泡排序 O(n^2) int[] arr2 = new int[80000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 insert(arr2); long end = System.currentTimeMillis(); System.out.println("花费的时间为:"+(end-start)+"ms"); } //插入排序 public static void insert(int[] arr){ /*//第一轮 int indexVal = arr[1]; int insertIndex = 1-1; // arr[1] 前面的位置的下标 //给 indexVal找插入的位置(从本位置向前找) // insertIndex >= 0 保证在给 insertVal找位置不会越界 // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较 while ( insertIndex >= 0 && indexVal < arr[insertIndex]){ arr[insertIndex+1] = arr[insertIndex]; insertIndex -- ; } //当while循环退出时,说明插入的位置找到, insertIndex+1 arr[insertIndex+1] = indexVal; System.out.println("第一轮插入排序:"+ Arrays.toString(arr)); //第二轮 indexVal = arr[2]; insertIndex = 2-1; // arr[1] 前面的位置的下标 //给 indexVal找插入的位置(从本位置向前找) // insertIndex >= 0 保证在给 insertVal找位置不会越界 // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较 while ( insertIndex >= 0 && indexVal < arr[insertIndex]){ arr[insertIndex+1] = arr[insertIndex]; insertIndex -- ; } //当while循环退出时,说明插入的位置找到, insertIndex+1 arr[insertIndex+1] = indexVal; System.out.println("第二轮插入排序:"+ Arrays.toString(arr)); //第三轮 indexVal = arr[3]; insertIndex = 3-1; // arr[1] 前面的位置的下标 //给 indexVal找插入的位置(从本位置向前找) // insertIndex >= 0 保证在给 insertVal找位置不会越界 // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较 while ( insertIndex >= 0 && indexVal < arr[insertIndex]){ arr[insertIndex+1] = arr[insertIndex]; insertIndex -- ; } //当while循环退出时,说明插入的位置找到, insertIndex+1 arr[insertIndex+1] = indexVal; System.out.println("第三轮插入排序:"+ Arrays.toString(arr));*/ int indexVal; int insertIndex; for(int i = 1; i < arr.length ; i++){ indexVal = arr[i]; insertIndex = i-1; // arr[i] 前面的位置的下标 //给 indexVal找插入的位置(从本位置向前找) // insertIndex >= 0 保证在给 insertVal找位置不会越界 // indexVal < arr[insertIndex] 表示insertIndex 下标的数 大于 indexVak ,所以得继续向前比较 while ( insertIndex >= 0 && indexVal < arr[insertIndex]){ arr[insertIndex+1] = arr[insertIndex]; insertIndex -- ; } //当while循环退出时,说明插入的位置找到, insertIndex+1 arr[insertIndex+1] = indexVal; //System.out.println("第"+i+"轮插入排序:"+ Arrays.toString(arr)); } } }测试排序八万个数据的时间:
花费的时间为:647ms
简单插入排序存在的问题
我们看简单的插入排序可能存在的问题. 数组 arr = {2,3,4,5,6,1} 这时需要插入的数 1(最小), 这样的过程是: {2,3,4,5,6,6} {2,3,4,5,5,6} {2,3,4,4,5,6} {2,3,3,4,5,6} {2,2,3,4,5,6} {1,2,3,4,5,6}结论: 当需要插入的数是较小的数时,后移的次数明显增多,对效率有影响
希尔排序是希尔(Donald Shell)于1959年提出的一种排序算法。希尔排序也是一种插入排序,它是简单插入排序经过改进之后的一个更高效的版本,也称为缩小增量排序。
希尔排序法基本思想
希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止
希尔排序法的示意图
希尔排序法的应用实例
有一群小牛, 考试成绩分别是 {8,9,1,7,2,3,5,4,6,0} 请从小到大排序. 请分别使用
1)希尔排序时, 对有序序列在插入时采用交换法, 并测试排序速度.
2)希尔排序时, 对有序序列在插入时采用移动法, 并测试排序速度
代码实现:
package sorting; import java.util.Arrays; /** * @description: //希尔排序 * @auther:田坤 * @date 2020/10/8 16:34 **/ public class ShellSorting { public static void main(String[] args) { int[] arr = {8,5,3,7,9,0,2,4,1,6}; //shell(arr); //shell2(arr); //验证八万个数据交换希尔排序的时间 int[] arr2 = new int[80000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 shell(arr2); long end = System.currentTimeMillis(); System.out.println("交换希尔排序花费的时间为:"+(end-start)+"ms"); start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 shell2(arr2); end = System.currentTimeMillis(); System.out.println("移动希尔排序花费的时间为:"+(end-start)+"ms"); } //交换法 public static void shell(int[] arr){ int temp; /*//第一轮 10/2 = 5组 for (int i = 5 ; i < arr.length; i++){ //遍历各组中所有的元素(各5组,每组有俩个元素),步长为 5 for(int j = i-5 ; j >= 0 ; j -= 5){ if(arr[j] > arr[j+5]){ temp = arr[j]; arr[j] = arr[j+5]; arr[j+5] = temp; } } } System.out.println("第一轮排序后:"+ Arrays.toString(arr)); //第二轮 5/2 = 2组 for (int i = 2 ; i < arr.length; i++){ //遍历各组中所有的元素(各2组,每组有5个元素),步长为 2 for(int j = i-2 ; j >= 0 ; j -= 2){ if(arr[j] > arr[j+2]){ temp = arr[j]; arr[j] = arr[j+2]; arr[j+2] = temp; } } } System.out.println("第二轮排序后:"+ Arrays.toString(arr)); //第三轮 2/2 = 1组 for (int i = 1 ; i < arr.length; i++){ //遍历各组中所有的元素(各1组,每组有10个元素),步长为 1 for(int j = i-1 ; j >= 0 ; j -= 1){ if(arr[j] > arr[j+1]){ temp = arr[j]; arr[j] = arr[j+1]; arr[j+1] = temp; } } } System.out.println("第三轮排序后:"+ Arrays.toString(arr));*/ for(int gap = arr.length/2 ; gap > 0 ; gap /= 2){ //遍历各组中所有的元素(各gap组,每组有 arr.length/gap 个元素),步长为 gap for (int i = gap ; i < arr.length; i++){ for(int j = i-gap ; j >= 0 ; j -= gap){ if(arr[j] > arr[j+gap]){ temp = arr[j]; arr[j] = arr[j+gap]; arr[j+gap] = temp; } } } //System.out.println("第三轮排序后:"+ Arrays.toString(arr)); } } //移动法 public static void shell2(int[] arr){ int temp,j; int count = 0; //增量gap,逐步的缩小增量 for(int gap = arr.length/2 ; gap > 0 ; gap /= 2){ //从第gap 个元素,逐个对其所在的组进行直接插入排序 for(int i =gap ; i < arr.length ; i++){ j = i; temp = arr[j]; if(arr[j] < arr[j-gap]){ while (j-gap>= 0 && temp < arr[j-gap]){ arr[j] = arr[j-gap]; j -= gap; } arr[j] = temp; } } //System.out.println("第"+(++count)+"轮排序后:"+ Arrays.toString(arr)); } } }交换法和移动法排序八万个数据所花费的时间:
交换希尔排序花费的时间为:8416ms 移动希尔排序花费的时间为:6ms
听韩老师的没听太懂,于是在网上找了个比较容易理解的思路
https://blog.csdn.net/morewindows/article/details/6684558
快速排序是C.R.A.Hoare于1962年提出的一种划分交换排序。它采用了一种分治的策略,通常称其为分治法(Divide-and-ConquerMethod)。
该方法的基本思想是:
1.先从数列中取出一个数作为基准数。
2.分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。
3.再对左右区间重复第二步,直到各区间只有一个数。
虽然快速排序称为分治法,但分治法这三个字显然无法很好的概括快速排序的全部步骤。因此我的对快速排序作了进一步的说明:挖坑填数+分治法:
以一个数组作为示例,取区间第一个数为基准数。
0
1
2
3
4
5
6
7
8
9
72
6
57
88
60
42
83
73
48
85
初始时,i = 0; j = 9; X = a[i] = 72
由于已经将a[0]中的数保存到X中,可以理解成在数组a[0]上挖了个坑,可以将其它数据填充到这来。
从j开始向前找一个比X小或等于X的数。当j=8,符合条件,将a[8]挖出再填到上一个坑a[0]中。a[0]=a[8]; i++; 这样一个坑a[0]就被搞定了,但又形成了一个新坑a[8],这怎么办了?简单,再找数字来填a[8]这个坑。这次从i开始向后找一个大于X的数,当i=3,符合条件,将a[3]挖出再填到上一个坑中a[8]=a[3]; j--;
数组变为:
0
1
2
3
4
5
6
7
8
9
48
6
57
88
60
42
83
73
88
85
i = 3; j = 7; X=72
再重复上面的步骤,先从后向前找,再从前向后找。
从j开始向前找,当j=5,符合条件,将a[5]挖出填到上一个坑中,a[3] = a[5]; i++;
从i开始向后找,当i=5时,由于i==j退出。
此时,i = j = 5,而a[5]刚好又是上次挖的坑,因此将X填入a[5]。
数组变为:
0
1
2
3
4
5
6
7
8
9
48
6
57
42
60
72
83
73
88
85
可以看出a[5]前面的数字都小于它,a[5]后面的数字都大于它。因此再对a[0…4]和a[6…9]这二个子区间重复上述步骤就可以了。
对挖坑填数进行总结
1.i =L; j = R; 将基准数挖出形成第一个坑a[i]。
2.j--由后向前找比它小的数,找到后挖出此数填前一个坑a[i]中。
3.i++由前向后找比它大的数,找到后也挖出此数填到前一个坑a[j]中。
4.再重复执行2,3二步,直到i==j,将基准数填入a[i]中。
照着这个总结很容易实现挖坑填数的代码:
int AdjustArray(int s[], int l, int r) //返回调整后基准数的位置 { int i = l, j = r; int x = s[l]; //s[l]即s[i]就是第一个坑 while (i < j) { // 从右向左找小于x的数来填s[i] while(i < j && s[j] >= x) j--; if(i < j) { s[i] = s[j]; //将s[j]填到s[i]中,s[j]就形成了一个新的坑 i++; } // 从左向右找大于或等于x的数来填s[j] while(i < j && s[i] < x) i++; if(i < j) { s[j] = s[i]; //将s[i]填到s[j]中,s[i]就形成了一个新的坑 j--; } } //退出时,i等于j。将x填到这个坑中。 s[i] = x; return i; }再写分治法的代码:
void quick_sort1(int s[], int l, int r) { if (l < r) { int i = AdjustArray(s, l, r);//先成挖坑填数法调整s[] quick_sort1(s, l, i - 1); // 递归调用 quick_sort1(s, i + 1, r); } }这样的代码显然不够简洁,对其组合整理下:
//快速排序 void quick_sort(int s[], int l, int r) { if (l < r) { //Swap(s[l], s[(l + r) / 2]); //将中间的这个数和第一个数交换 参见注1 int i = l, j = r, x = s[l]; while (i < j) { while(i < j && s[j] >= x) // 从右向左找第一个小于x的数 j--; if(i < j) s[i++] = s[j]; while(i < j && s[i] < x) // 从左向右找第一个大于等于x的数 i++; if(i < j) s[j--] = s[i]; } s[i] = x; quick_sort(s, l, i - 1); // 递归调用 quick_sort(s, i + 1, r); } }测试八万个数据的排序
快速排序花费的时间为:36ms
归并排序(MERGE-SORT)是利用归并的思想实现的排序方法,该算法采用经典的分治(divide-and-conquer)策略(分治法将问题分(divide)成一些小的问题然后递归求解,而治(conquer)的阶段则将分的阶段得到的各答案"修补"在一起,即分而治之)。
归并排序思想示意图1-基本思想
说明:
可以看到这种结构很像一棵完全二叉树,本文的归并排序我们采用递归去实现(也可采用迭代的方式去实现)。分阶段可以理解为就是递归拆分子序列的过程。
归并排序思想示意图2-合并相邻有序子序列:
再来看看治阶段,我们需要将两个已经有序的子序列合并成一个有序序列,比如上图中的最后一次合并,要将[4,5,7,8]和[1,2,3,6]两个已经有序的子序列,合并为最终序列[1,2,3,4,5,6,7,8],来看下实现步骤
归并排序的应用实例:
给你一个数组, val arr = Array {8,4,5,9,1,3,6,2};, 请使用归并排序完成排序。
package sorting; import java.util.Arrays; /** * @description: 归并排序 * @auther:田坤 * @date 2020/10/8 20:37 **/ public class MergeSorting { public static void main(String[] args) { int[] arr = {8,4,5,9,1,3,6,2}; int[] temp = new int[arr.length]; mergeSorting(arr,0,arr.length-1,temp); System.out.println("排序后的数组:"+ Arrays.toString(arr)); //测试80000个数据排序花费的时间 int[] arr2 = new int[80000]; int[] temp1 = new int[arr2.length]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 mergeSorting(arr2,0,arr2.length-1,temp1); long end = System.currentTimeMillis(); System.out.println("归并排序花费的时间为:"+(end-start)+"ms"); } public static void mergeSorting(int[] arr, int left, int right, int[] temp) { if(left < right){ int mid = (left + right)/2; //中间索引 //向左递归进行分解 mergeSorting(arr,left,mid,temp); //向右递归进行分解 mergeSorting(arr,mid+1,right,temp); //合并 merge(arr,left,right,mid,temp); } } //合并 /** * @param arr 排序的原始数组 * @param left 左边有序序列的初始索引 * @param right 右边索引 (右边有序的末位索引) * @param mid 中间索引(左边有序序列的未位索引) * @param temp 做中转的数组 */ public static void merge(int[] arr, int left, int right, int mid, int[] temp) { int i = left; //左边有序序列的初始索引 int j = mid + 1; //右边有序序列的初始索引 int t = 0; //指向temp数组的当前索引 //先把左右两边的有序序列按照规则(小到大 || 大到小)加入到temp数组中 直到有一边处理完 while (i <= mid && j <= right) { //如果左边有序序列的当前元素小于右边有序序列的当前元素,则将左边的当前元素加入到temp数组 if (arr[i] < arr[j]) { temp[t++] = arr[i++]; } else { temp[t++] = arr[j++]; } } //左边未填充完 while (i <= mid) { temp[t++] = arr[i++]; } //右边未填充完 while (j <= right) { temp[t++] = arr[j++]; } //将temp数组的元素拷贝到arr 注意:并不是每次都拷贝所有 t = 0; int templeft = left; //第一次合并: templeft=0 right=1 二: templeft=2 right=3 //三: templeft=0 right=3 //System.out.println("templeft="+templeft + " right="+right); while (templeft <= right) arr[templeft++] = temp[t++]; } }测试八万个数据排序:
归并排序花费的时间为:21ms
基数排序(桶排序)介绍:
1)基数排序(radix sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是通过键值的各个位的值,将要排序的元素分配至某些“桶”中,达到排序的作用。
2)基数排序法是属于稳定性的排序,基数排序法的是效率高的稳定性排序法
3)基数排序(Radix Sort)是桶排序的扩展
4)基数排序是1887年赫尔曼·何乐礼发明的。它是这样实现的:将整数按位数切割成不同的数字,然后按每个位数分别比较。
基数排序基本思想
将所有待比较数值统一为同样的数位长度,数位较短的数前面补零。然后,从最低位开始,依次进行一次排序。这样从最低位排序一直到最高位排序完成以后, 数列就变成一个有序序列。
基数排序的图文说明
要求:将数组 {53, 3, 542, 748, 14, 214} 使用基数排序, 进行升序排序。
代码实现:
package sorting; import java.util.Arrays; /** * @description: 基数排序 * @auther:田坤 * @date 2020/10/9 6:43 **/ public class RadixSorting { public static void main(String[] args) { int[] arr = {53, 3, 542, 748, 14, 214 }; //radix(arr); //验证八万个数据基数排序的时间 int[] arr2 = new int[80000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } long start = System.currentTimeMillis(); //获取当前系统时间的毫秒数 radix(arr2); long end = System.currentTimeMillis(); System.out.println("基数排序花费的时间为:"+(end-start)+"ms"); // 800000000 * 11 * 4 / 1024 / 1024 = 33G //验证八亿个数据基数排序的时间 int[] arr3 = new int[800000000]; for(int i = 0 ; i < arr2.length ; i++){ arr2[i] = (int)(Math.random() * 8000000); //生成一个[0,8000000)的数 } } //基数排序 public static void radix(int[] arr){ //创建一个二维数组来模拟10个桶,每个桶都是一个一位数组 //为了防止数据越界,每个桶的长度等于排序数组的长度 //所以基数排序是典型的用空间换时间算法 int[][] bucket = new int[10][arr.length]; //定义一个一维数组用来存储每个桶存储数据的个数 int[] bucketElementCount = new int[10]; //找出arr中的最大数,求出它是几位数 int max = arr[0]; int index; //回填数据到arr里的索引 for(int i = 0; i < arr.length ; i++){ if(arr[i] > max) max = arr[i]; } int maxLength = (max+"").length(); //最大数是几位数 for(int i = 0, n = 1; i < maxLength ; i++,n*=10){ //针对每个元素所对应位来进行排序处理 for(int j = 0 ; j < arr.length ; j++){ //取出每个元素对应位的数 int unitsDigit = arr[j] /n % 10; //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++ bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j]; bucketElementCount[unitsDigit]++; } index = 0; //将桶中的数据依次放入原数组中去 for(int j = 0 ;j < bucket.length ; j++){ for(int k = 0 ; k < bucketElementCount[j] ; k++){ arr[index++] = bucket[j][k]; } bucketElementCount[j] = 0; } //System.out.println("第"+(i+1)+"轮排序:"+ Arrays.toString(arr)); } /*//第一轮 放个位数 for(int j = 0 ; j < arr.length ; j++){ //个位数 int unitsDigit = arr[j] / 1 % 10; //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++ bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j]; bucketElementCount[unitsDigit]++; } int index = 0; //将桶中的数据依次放入原数组中去 for(int j = 0 ;j < bucket.length ; j++){ for(int k = 0 ; k < bucketElementCount[j] ; k++){ arr[index++] = bucket[j][k]; } bucketElementCount[j] = 0; } System.out.println("第一轮排序:"+ Arrays.toString(arr)); //第二轮 放十位数 for(int j = 0 ; j < arr.length ; j++){ //个位数 int unitsDigit = arr[j] / 10 % 10; //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++ bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j]; bucketElementCount[unitsDigit]++; } index = 0; //将桶中的数据依次放入原数组中去 for(int j = 0 ;j < bucket.length ; j++){ for(int k = 0 ; k < bucketElementCount[j] ; k++){ arr[index++] = bucket[j][k]; } bucketElementCount[j] = 0; } System.out.println("第二轮排序:"+ Arrays.toString(arr)); //第三轮 放百位数 for(int j = 0 ; j < arr.length ; j++){ //个位数 int unitsDigit = arr[j] / 100 % 10; //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++ bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j]; bucketElementCount[unitsDigit]++; } index = 0; //将桶中的数据依次放入原数组中去 for(int j = 0 ;j < bucket.length ; j++){ for(int k = 0 ; k < bucketElementCount[j] ; k++){ arr[index++] = bucket[j][k]; } bucketElementCount[j] = 0; } System.out.println("第三轮排序:"+ Arrays.toString(arr)); */ } }测试数据排序结果
//测试八万个数据排序:
基数排序花费的时间为:49ms
//测试八亿个数据排序: 内存不够 800000000 * 11 * 4 / 1024 / 1024 = 33G
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space at sorting.RadixSorting.radix(RadixSorting.java:42) at sorting.RadixSorting.main(RadixSorting.java:32)
对基数排序数组的一点小改进
因为创建二维数组每个桶的长度因为装不下(越界)所以长度给的都是整个排序数组的长度,那么显然这个会使二维数组(bucket)的占用空间大大增大。所以我在场景二维数组(bucket)他的二维数组行的个数先设置的比较小(排序数据的十分之一),如果数组满了,进行扩容 (扩容后的大小 = 原有的大小 + 原有的大小 / 2)
//对二维数组的某一行进行扩容 public static void dilatation(int[][] arr,int row){ int[] newArr = new int[arr[row].length + arr[row].length /2]; //将原来二维数组row行的数据复制给newArr for (int i = 0; i < arr[row].length; i++) { newArr[i] = arr[row][i]; } arr[row] = newArr; } //基数排序 public static void radix(int[] arr){ //创建一个二维数组来模拟10个桶,每个桶都是一个一位数组 //为了防止数据越界,每个桶的长度等于排序数组的长度 //所以基数排序是典型的用空间换时间算法 int[][] bucket = new int[10][arr.length / 10]; //定义一个一维数组用来存储每个桶存储数据的个数 int[] bucketElementCount = new int[10]; //找出arr中的最大数,求出它是几位数 int max = arr[0]; int index; //回填数据到arr里的索引 for(int i = 0; i < arr.length ; i++){ if(arr[i] > max) max = arr[i]; } int maxLength = (max+"").length(); //最大数是几位数 for(int i = 0, n = 1; i < maxLength ; i++,n*=10){ //针对每个元素所对应位来进行排序处理 for(int j = 0 ; j < arr.length ; j++){ //取出每个元素对应位的数 int unitsDigit = arr[j] /n % 10; //将个位数不同的放置在不同的桶(0-9)中,并且使得存储每个桐桶中个数的bucketElementCount[unitsDigit]++ if(bucket[unitsDigit].length != bucketElementCount[unitsDigit]){ bucket[unitsDigit][bucketElementCount[unitsDigit]] = arr[j]; }else { //如果我的数组满了,进行扩容 dilatation(bucket,unitsDigit); } bucketElementCount[unitsDigit]++; } index = 0; //将桶中的数据依次放入原数组中去 for(int j = 0 ;j < bucket.length ; j++){ for(int k = 0 ; k < bucketElementCount[j] ; k++){ arr[index++] = bucket[j][k]; } bucketElementCount[j] = 0; } //System.out.println("第"+(i+1)+"轮排序:"+ Arrays.toString(arr)); }
我也不知道该怎么进行合理的测试,我就测试了十几个值所输出的结果:(我电脑16G的内存,)
改进前的基数排序,数据大于100000000就会内存不够。
而我改进后,250000000也是可以进行排序的
以下是我测试俩种方法的效率对比:(因为跑一次得十秒我也没多跑,跑了30次) 以下结果为:跑了三十次,每一次对比看谁用的时间多,就单纯结果对比来说,改进后的基数排序比原先的基数排序速度更快,更节省空间
改进前:25 改进后:5
关于基础排序的说明:
1)基数排序是对传统桶排序的扩展,速度很快.
2)基数排序是经典的空间换时间的方式,占用内存很大, 当对海量数据排序时,容易造成 OutOfMemoryError 。
3)基数排序是稳定的。[注:假定在待排序的记录序列中,存在多个具有相同的关键字的记录,若经过排序,这些记录的相对次序保持不变,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,则称这种排序算法是稳定的;否则称为不稳定的]
4)有负数的数组,我们不用基数排序来进行排序, 如果要支持负数
将数组中的负数整数分开,使它们成为正数,然后使用基数排序为正值,然后反转并附加排序后的非负数组。
相关术语解释:
1)稳定:如果a原本在b前面,而a=b,排序之后a仍然在b的前面;2)不稳定:如果a原本在b的前面,而a=b,排序之后a可能会出现在b的后面;3)内排序:所有排序操作都在内存中完成;4)外排序:由于数据太大,因此把数据放在磁盘中,而排序通过磁盘和内存的数据传输才能进行;
5)时间复杂度: 一个算法执行所耗费的时间。6)空间复杂度:运行完一个程序所需内存的大小。7)n: 数据规模8)k: “桶”的个数9)In-place: 不占用额外内存10)Out-place: 占用额外内存