ZH奶酪：【数据结构与算法】基础排序算法总结与Python实现

tanggang1740 发表于 2015-11-30 09:33:05

1、冒泡排序（BubbleSort）
　　介绍：重复的遍历数列，一次比较两个元素，如果他们顺序错误就进行交换。

1 def bubble_sort(arry):
2 n = len(arry)                #获得数组的长度
3 for i in range(n):
4       for j in range(1,n-i):
5          ifarry > arry :    #如果前者比后者大
6             arry,arry = arry,arry    #则交换两者
7 return arry
　　
　　优化方案：
　　（1）某一趟遍历如果没有数据交换，则说明已经排好了；
　　（2）记录某次遍历时最后发生数据交换的位置，这个位置之后的数据显然已经有序了，不用再排序了；

2、选择排序（SelectionSort）
　　介绍：从未排序的数列中找到最小（大）的元素，放在数列的起始（末尾），直到整个数列都进行了排序；

1 def select_sort(ary):
2 n = len(ary)
3 for i in range(0,n):
4       min = i                         #最小元素下标标记
5       for j in range(i+1,n):
6          if ary < ary :
7             min = j                   #找到最小值的下标
8       ary,ary = ary,ary #交换两者
9 return ary
3、插入排序（InsertionSort）
　　介绍：一个有序数列，一个无序数列，遍历无序数列，把数据插入到有序数列的相应位置；

1 def insert_sort(ary):
2 n = len(ary)
3 for i in range(1,n):
4       if ary < ary:
5          temp = ary
6          index = i       #待插入的下标
7          for j in range(i-1,-1,-1):#从i-1 循环到 0 (包括0)
8             if ary > temp :
9                   ary = ary
10                   index = j #记录待插入下标
11             else :
12                   break
13          ary = temp
14 return ary
4、希尔排序（ShellSort）
　　介绍：也称为递减增量排序算法，实质是分组插入排序。希尔排序是非稳定排序算法。
　　基本思想：将数组列在一个表中，对表的每列进行插入排序，重复这个过程，每次增加列的长度，直到最后只有一列。（把数组说成是表是为了更好理解这个算法，算法本身还是用数组进行排序）
　　例如，有数组 [ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ] ，我们先以步长为5进行排序，我们可以通过将数组放到有5列的表中进行观察：

13 14 94 33 82
25 59 94 65 23
45 27 73 25 39
10
　　然后对每列进行插入排序：

10 14 73 25 23
13 27 94 33 39
25 59 94 65 82
45
　　这时候数组实际上是这样的： [ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ] 。这时10已经处于正确位置了，然后再以步长3进行排序：

10 14 73
25 23 13
27 94 33
39 25 59
94 65 82
45
　　对每列进行插入排序之后是这样的：

10 14 13
25 23 33
27 25 59
39 65 73
45 94 82
94
　　最后以步长1排序（就是简单的插入排序了）

1 def shell_sort(ary):
2 n = len(ary)
3 gap = round(n/2)    #初始步长 , 用round四舍五入取整
4 while gap > 0 :
5       for i in range(gap,n):    #每一列进行插入排序 , 从gap 到 n-1
6          temp = ary
7          j = i
8          while ( j >= gap and ary > temp ): #插入排序
9             ary = ary
10             j = j - gap
11          ary = temp
12       gap = round(gap/2)                   #重新设置步长
13 return ary
　　上面源码的步长的选择是从n/2开始，每次再减半，直至为0。步长的选择直接决定了希尔排序的复杂度。

希尔排序动画演示
　　http://www.cs.usfca.edu/~galles/visualization/ComparisonSort.html

5、归并排序（MergeSort）
　　介绍：归并排序是采用分治法的一个典型应用。
　　基本思想：先递归分解数组，再合并数组；
　　先考虑简单一点的，合并两个有序数组，基本思路就是比较两个数组的最前面的数，谁小就取谁，取了后相应的指针就往后移一位，然后再比较，直至一个数组为空，最后把一个数组剩余部分复制过来即可。
　　再考虑把上述问题进行递归分解，基本思路就是将数组分解成left和right两部分，如果这两个数组内部的数据是有序的，那么就可以用上面合并数组的方法将这个两个数组合并排序。如何让这两个数组内部是有序的呢？可以再二分，直至分解出的小组只含有一个元素位置，此时认为该小组内部有序，然后合并排序相邻的两个小组即可。

1 def merge_sort(ary):
2 if len(ary) <= 1 : return ary
3 num = int(len(ary)/2)    #二分分解
4 left = merge_sort(ary[:num])
5 right = merge_sort(ary)
6 return merge(left,right) #合并数组
7
8 def merge(left,right):
9 '''合并操作，
10 将两个有序数组left[]和right[]合并成一个大的有序数组'''
11 l,r = 0,0       #left与right数组的下标指针
12 result = []
13 while l<len(left) and r<len(right) :
14       if left < right:
15          result.append(left)
16          l += 1
17       else:
18          result.append(right)
19          r += 1
20 result += left
21 result += right
22 return result
6、快速排序（QuickSort）
　　介绍：
　　快速排序通常明显比同为O(n*logn)的其他算法更快，因此常被采用，而且快排也采用了分治法的思想，所以在很多笔试面试中经常看到快排的影子。
　　（1）从数列中挑出一个元素作为基准数；
　　（2）分区过程，将比基数大的放到右边，小于或等于基数的放到左边；
　　（3）再对左右区间递归执行（2），直至各区间只有一个数；

1 def quick_sort(ary):
2 return qsort(ary,0,len(ary)-1)
3
4 def qsort(ary,left,right):
5 #快排函数，ary为待排序数组，left为待排序的左边界，right为右边界
6 if left >= right : return ary
7 key = ary #取最左边的为基准数
8 lp = left       #左指针
9 rp = right       #右指针
10 while lp < rp :
11       while ary >= key and lp < rp :
12          rp -= 1
13       while ary <= key and lp < rp :
14          lp += 1
15       ary,ary = ary,ary
16 ary,ary = ary,ary
17 qsort(ary,left,lp-1)
18 qsort(ary,rp+1,right)
19 return ary
7、堆排序（HeapSort）
　　介绍：
　　堆排序在top K问题中使用比较频繁。堆排序是采用二叉堆的数据结构来实现的，虽然实质上还是一维数组。二叉堆是一个近似完全二叉树。
　　二叉堆有以下性质：
　　（1）父节点的键值总是大于（小于）或等于任何一个子节点的键值；
　　（2）每个节点的左右子树都是一个二叉堆
　　步骤：
　　（1）构造最大堆（Build_Max_Heap）：若数组下标范围为0~n，考虑到单独一个元素是大根堆，则从下标n/2开始的元素均为大根堆。于是只要从n/2-1开始，向前一次构造大根堆，这样就能保证，构造到某个节点时，它的左右子树都已经是大根堆；
　　（2）堆排序（HeapSort）：由于堆是用数组模拟的，得到一个大根堆后，数组内部并不是有序的。因此需要将堆化数组有序化。
　　思想是：移除根节点并做最大堆调整的递归运算。
　　第一次将heap和heap交换，再对heap做最大堆调整。
　　第二次将heap和heap交换，再对heap做最大堆调整。
　　重复上述操作直至heap与heap交换。
　　由于每次都是将最大的数并入到后面的有序区间，故操作完后整个数组就是有序的了。
　　（3）最大堆调整（Max_Heapify）：该方法是提供给上述两个过程调用的。目的是将堆的末端子节点做调整，似的子节点永远小于父节点。

1 def heap_sort(ary) :
2 n = len(ary)
3 first = int(n/2-1)    #最后一个非叶子节点
4 for start in range(first,-1,-1) : #构造大根堆
5       max_heapify(ary,start,n-1)
6 for end in range(n-1,0,-1):       #堆排，将大根堆转换成有序数组
7       ary,ary = ary,ary
8       max_heapify(ary,0,end-1)
9 return ary
10
11
12 #最大堆调整：将堆的末端子节点作调整，使得子节点永远小于父节点
13 #start为当前需要调整最大堆的位置，end为调整边界
14 def max_heapify(ary,start,end):
15 root = start
16 while True :
17       child = root*2 +1             #调整节点的子节点
18       if child > end : break
19       if child+1 <= end and ary < ary :
20          child = child+1          #取较大的子节点
21       if ary < ary : #较大的子节点成为父节点
22          ary,ary = ary,ary #交换
23          root = child
24       else :
25          break
总结
　　上述七种排序算法的对比：

　　原文链接：http://wuchong.me/blog/2014/02/09/algorithm-sort-summary/

页: [1]

运维网's Archiver

ZH奶酪：【数据结构与算法】基础排序算法总结与Python实现