前言
快速排序作为较为经典的一种排序算法,其核心思想不得不提——分治法。
分治法
分治法,英文名称为Divide and Conquer(D&C),简而言之,就是分而治之,是一种解决问题的思路。 其基本原理为:
- 找出简单的基线条件。
- 确定如何缩小问题的规模,使其符合基线条件。
举一个例子: 首先,我们给定一个数组:[2, 4, 6],希望利用递归的方法来完成累加值,应该怎样做呢?
第一步,找出基线条件。在这种情境下,我们可以推断出,当一个数组为空,自然计算起来是最直接的。因此,基线条件为:
第二步,我们需要让每次递归,都距离我们所定义的基线条件更进一步——也即离空数组更近一步,我们可以得出以下等式:
sum([2, 4, 6] 2 + sum([4, 6]
上述两种表达都是等价的,但在第二种表达方法中,传递给sum函数的数组更短,换言之,问题的规模得到了缩减!
因此,整体利用分支思路的sum函数执行起来是这样的:
- 接受一个数组
- 如果数组为空,则返回0
- 否则,计算除了第一个元素之外的其他数字之和,与第一个元素相加,并返回
代码实现:
def dc_sum(nums):
if not nums:
return 0
return nums[0] + dc_sum([1:])
快速排序
快速排序,就是D&C思路的最好运用。这里,我们利用分治思想来对该算法做详细分析。
首先,我们需要思考的是,对于排序算法而言,什么样的数组是最简单、不需要排序的呢?
- 自然是空数组、或者只包含一个元素的数组,这时根本不需要排序:
def quick_sort(nums):
if len(nums) < 2:
return nums
而当数组元素的个数大于两个呢?
回到分治法中,我们需要不断的缩小问题的规模,也即我们要不断的将数组进行分解,直到满足我们上面所定义的基线条件。
举一个例子: 当我们希望对数组[33, 10, 15, 7]进行排序,应该怎样做呢?
第一步,我们需要从数组中取一个元素,这个元素被我们成为基准值(pivot):这里我们取第一个元素33作为基准值。
第二步,我们找出所有比基准值大的元素,以及所有比基准值小的元素,这个过程被称为分区(partitioning):
- 比基准值大的:[]
- 比基准值小的:[10, 15, 7]
此时,我们可以得到三部分:
- 一个由所有小于基准值的数字组成的左侧子数组;
- 基准值
- 一个由所有大于基准值的数字组成的右侧子数组;
倘若左右子数组均是有序的,那么我们直接进行拼接,就能够得到完美的排序后数组了:
但是我们如何确保子数组是有序的呢? 这里,由最初我们设定的基线条件可知,若子数组长度小于2,那么一定是有序的,那么此时我们只需要递归的对左右子数组再次使用快速排序,再合并相关结果,就一定能得到有序的子数组了!
第三步,分别对左右两侧的子数组再次使用快速排序,直至满足基线条件。 由于我们是递归的调用,因此,在函数栈返回时,自然是一个个子数组与对应基准值的拼接,最终得到一个完全有序的数组了。
代码实现:
def quick_sort(nums):
if len(nums) < 2:
return nums
else:
pivot = nums[0]
less = [n for n in nums[1:] if n <= pivot]
greater = [n for n in nums[1:] if n > pivot]
return quick_sort(less) + pivot + quick_sort(greater)
|