vlambda博客
学习文章列表

选择排序算法 -- Python实现

今天我们来分享一下选择排序的算法。任何算法都离不开系统的内存,所以在正式介绍选择排序之前,先来了解一些内存的工作原理。

假设我们去超市买东西,需要将东西寄存,但是寄存的柜子有一个要求(我们假设有这样一个要求):每个寄存柜都只能存放一样东西。如果你有两样东西,比如一杯可乐,和一块面包,那么你需要两个寄存柜,然后你会得到这两个寄存柜的号码。



数组和链表

我们先来考虑数组的情况,因为数组相对比较好理解。

如果又来了一位朋友,而当前坐的地方也没有空位,你们就得再次转移!真是太麻烦了。同样,在数组中添加新元素也可能很麻烦。如果没有了空间,就得移到内存的其他地方,因此添加 新元素的速度会很慢。一种解决之道是“预留座位”:即便当前只有3个待办事项,也请计算机提 供10个位置,以防需要添加待办事项。这样,只要待办事项不超过10个,就无需转移。这是一个 不错的权变措施,但你应该明白,它存在如下两个缺点:

1)你额外请求的位置可能根本用不上,这将浪费内存。你没有使用,别人也用不了;

2)待办事项超过10个后,你还得转移。

因此,这种权宜措施虽然不错,但绝非完美的解决方案。对于这种问题,可使用链表来解决。

链表

链表中的元素可存储在内存的任何地方。

选择排序算法 -- Python实现

选择排序算法 -- Python实现

使用链表时,根本就不需要移动元素。这还可避免另一个问题。假设你与五位朋友去看一部很火的电影。你们六人想坐在一起,但看电影的人较多,没有六个在一起的座位。使用数组时有时就会遇到这样的情况。假设你要为数组分配10000个位置,内存中有10000个位置,但不都靠在一起。在这种情况下,你将无法为该数组分配内存!链表相当于说“我们分开来坐”,因此,只要有足够的内存空间,就能为链表分配内存。

链表的优势在插入元素方面,那数组的优势又是什么呢?

数组

排行榜网站使用卑鄙的手段来增加页面浏览量。它们不在一个页面中显示整个排行榜,而将排行榜的每项内容都放在一个页面中,并让你单击Next来查看下一项内容。例如,显示十大电视反派时,不在一个页面中显示整个排行榜,而是先显示第十大反派(Newman)。你必须在每个页面中单击Next,才能看到第一大反派(GustavoFring)。这让网站能够在10个页面中显示广告,但用户需要单击Next九次才能看到第一个,真的是很烦。如果整个排行榜都显示在一个页面中,将方便得多。这样,用户可单击排行榜中的人名来获得更详细的信息。

选择排序算法 -- Python实现


术语

数组的元素带编号,编号从0而不是1开始。例如,在下面的数组中,元素20的位置为1:

选择排序算法 -- Python实现

而元素10的位置为0。这通常会让新手晕头转向。从0开始让基于数组的代码编写起来更容易, 因此程序员始终坚持这样做。几乎所有的编程语言都从0开始对数组元素进行编号。你很快就会 习惯这种做法。
元素的位置称为索引。因此,不说“元素20的位置为1”,而说“元素20位于索引1处”。本书 将使用索引来表示位置。
下面列出了常见的数组和链表操作的运行时间:

选择排序算法 -- Python实现

在中间插入

假设你要让待办事项按日期排列。之前,你在清单末尾添加了待办事项。但现在你要根据新增待办事项的日期将其插入到正确的位置。

选择排序算法 -- Python实现

选择排序算法 -- Python实现

而使用数组时,则必须将后面的元素都向后移:

选择排序算法 -- Python实现


如果没有足够的空间,可能还得将整个数组复制到其他地方!因此,当需要在中间插入元素 时,链表是更好的选择。

删除

不同于插入,删除元素总能成功。如果内存中没有足够的空间,插入操作可能失败,但在任何情况下都能够将元素删除。

下面是常见数组和链表操作的运行时间:

选择排序算法 -- Python实现

需要指出的是,仅当能够立即访问要删除的元素时,删除操作的运行时间才为O(1)。通常我们都记录了链表的第一个元素和最后一个元素,因此删除这些元素时运行时间为O(1)。

数组和链表哪个用得更多呢?显然要看情况。但数组用得很多,因为它支持随机访问。有两种访问方式:随机访问和顺序访问。顺序访问意味着从第一个元素开始逐个地读取元素。链表只能顺序访问:要读取链表的第十个元素,得先读取前九个元素,并沿链接找到第十个元素。随机访问意味着可直接跳到第十个元素。我们经常说数组的读取速度更快,这是因为它们支持随机访问。很多情况都要求能够随机访问,因此数组用得很多。


选择排序

假设你的计算机存储了很多乐曲。对于每个乐队,你都记录了其作品被播放的次数

选择排序算法 -- Python实现

你要将这个列表按播放次数从多到少的顺序排列,从而将你喜欢的乐队排序。该如何做呢?一种办法是遍历这个列表,找出作品播放次数最多的乐队,并将该乐队添加到一个新列表中。

选择排序算法 -- Python实现

再次这样做,找出播放次数第二多的乐队…依此类推,你将得到一个有序列表:

选择排序算法 -- Python实现

下面从计算机科学的角度出发,看看这需要多长时间。O(n)时间意味着查看列表中的每个元素一次。例如,对乐队列表进行简单查找时,意味着每个乐队都要查看一次:

要找出播放次数最多的乐队,必须检查列表中的每个元素。正如你刚才看到的,这需要的时间为O(n)。因此对于这种时间为O(n)的操作,你需要执行n次:

需要的总时间为 O(n × n),即O(n2)。排序算法很有用。你现在可以对如下内容进行排序:

  • 旅行日期

  • 电子邮件(从新到旧)


选择排序是一种灵巧的算法,但其速度不是很快。下面是其实现代码:


def findSmallest(arr): smallest=arr[0] smallest_index=0 for i in range(1,len(arr)): if arr[i]<smallest: smallest=arr[i] smallest_index=i return smallest_indexdef selectionSort(arr): newArr=[] for i in range(len(arr)): smallest=findSmallest(arr) newArr.append(arr.pop(smallest)) return newArrprint(selectionSort([5,3,6,2,10]));