希尔排序
本页面将简要介绍希尔排序。
定义
希尔排序(英语:Shell sort),也称为缩小增量排序法,是 插入排序 的一种改进版本。希尔排序以它的发明者希尔(英语:Donald Shell)命名。
过程
排序对不相邻的记录进行比较和移动:
- 将待排序序列分为若干子序列(每个子序列的元素在原始数组中间距相同);
- 对这些子序列进行插入排序;
- 减小每个子序列中元素之间的间距,重复上述过程直至间距减少为 1 。 。
性质
稳定性
希尔排序是一种不稳定的排序算法。
时间复杂度
希尔排序的最优时间复杂度为 𝑂(𝑛) 。
。
希尔排序的平均时间复杂度和最坏时间复杂度与间距序列的选取有关。设间距序列为 𝐻 ,下面给出 𝐻
,下面给出 𝐻 的两种经典选取方式,这两种选取方式均使得排序算法的复杂度降为 𝑜(𝑛2)
 的两种经典选取方式,这两种选取方式均使得排序算法的复杂度降为 𝑜(𝑛2) 级别。
 级别。
命题 1
 若间距序列为 𝐻 ={2𝑘 −1 ∣𝑘 =1,2,…,⌊log2𝑛⌋} (从大到小),则希尔排序算法的时间复杂度为 𝑂(𝑛3/2)
(从大到小),则希尔排序算法的时间复杂度为 𝑂(𝑛3/2) 。
。
命题 2
 若间距序列为 𝐻 ={𝑘 =2𝑝 ⋅3𝑞 ∣𝑝,𝑞 ∈ℕ,𝑘 ≤𝑛} (从大到小),则希尔排序算法的时间复杂度为 𝑂(𝑛log2𝑛)
(从大到小),则希尔排序算法的时间复杂度为 𝑂(𝑛log2𝑛) 。
。
为证明这两个命题,我们先给出一个重要的定理并证明它,这个定理反应了希尔排序的最主要特征。
定理 1
 只要程序执行了一次 InsertionSort(ℎ) ,不管之后怎样调用 InsertionSort
,不管之后怎样调用 InsertionSort 函数,𝐴
 函数,𝐴 数组怎样变换,下列性质均会被一直保持:
 数组怎样变换,下列性质均会被一直保持:
 𝐴1,𝐴1+ℎ,𝐴1+2ℎ,…𝐴2,𝐴2+ℎ,𝐴2+2ℎ,…⋮𝐴ℎ,𝐴ℎ+ℎ,𝐴ℎ+2ℎ,…
接下来我们证明定理 1。
我们先证明引理 1。
引理 1
 对于整数 𝑛,𝑚 、正整数 𝑙
、正整数 𝑙 与两个数组 𝑋(𝑥1,𝑥2,…,𝑥𝑛+𝑙),𝑌(𝑦1,𝑦2,…,𝑦𝑚+𝑙)
 与两个数组 𝑋(𝑥1,𝑥2,…,𝑥𝑛+𝑙),𝑌(𝑦1,𝑦2,…,𝑦𝑚+𝑙) ,满足如下要求:
,满足如下要求:
 𝑦1≤𝑥𝑛+1,𝑦2≤𝑥𝑛+2,…,𝑦𝑙≤𝑥𝑛+𝑙 
 则我们将两个数组分别升序排序后,上述要求依然成立。
引理 1 证明
 设数组 𝑋 排序完为数组 𝑋′(𝑥′1,…,𝑥′𝑛+𝑙)
 排序完为数组 𝑋′(𝑥′1,…,𝑥′𝑛+𝑙) ,数组 𝑌
,数组 𝑌 排序完为数组 𝑌′(𝑦′1,…,𝑦′𝑚+𝑙)
 排序完为数组 𝑌′(𝑦′1,…,𝑦′𝑚+𝑙) 。
。
 对于任何 1 ≤𝑖 ≤𝑙 ,𝑥′𝑛+𝑖
,𝑥′𝑛+𝑖 小等于数组 𝑋′
 小等于数组 𝑋′ 中的 𝑙 −𝑖
 中的 𝑙 −𝑖 个元素,也小等于数组 𝑋
 个元素,也小等于数组 𝑋 中的 𝑙 −𝑖
 中的 𝑙 −𝑖 个元素(这是因为 𝑋
 个元素(这是因为 𝑋 与 𝑋′
 与 𝑋′ 的元素可重集合是相同的)。
 的元素可重集合是相同的)。
 那么在可重集合 {𝑥𝑛+1,…,𝑥𝑛+𝑙} ⊂𝑋 中,大等于 𝑥′𝑛+𝑖
 中,大等于 𝑥′𝑛+𝑖 的元素个数不超过 𝑙 −𝑖
 的元素个数不超过 𝑙 −𝑖 个。
 个。
 进而小于 𝑥′𝑛+𝑖 的元素个数至少有 𝑖
 的元素个数至少有 𝑖 个,取出其中的 𝑖
 个,取出其中的 𝑖 个,设它们为 𝑥𝑛+𝑘1,𝑥𝑛+𝑘2,…,𝑥𝑛+𝑘𝑖
 个,设它们为 𝑥𝑛+𝑘1,𝑥𝑛+𝑘2,…,𝑥𝑛+𝑘𝑖 。于是有:
。于是有:
 𝑦𝑘1≤𝑥𝑛+𝑘1≤𝑥′𝑛+𝑖,𝑦𝑘2≤𝑥𝑛+𝑘2≤𝑥′𝑛+𝑖,…,𝑦𝑘𝑖≤𝑥𝑛+𝑘𝑖≤𝑥′𝑛+𝑖 
 所以 𝑥′𝑛+𝑖 至少大于等于 𝑌
 至少大于等于 𝑌 也即 𝑌′
 也即 𝑌′ 中的 𝑖
 中的 𝑖 个元素,那么自然有 𝑦′𝑖 ≤𝑥′𝑛+𝑖 (1 ≤𝑖 ≤𝑙)
 个元素,那么自然有 𝑦′𝑖 ≤𝑥′𝑛+𝑖 (1 ≤𝑖 ≤𝑙) 。
。
再回到原命题的证明:
我们实际上只需要证明调用完 InsertionSort(ℎ) 的紧接着下一次调用 InsertionSort(𝑘)
 的紧接着下一次调用 InsertionSort(𝑘) 后,ℎ
 后,ℎ 个子列仍有序即可,之后容易用归纳法得出。下面只考虑下一个调用:
 个子列仍有序即可,之后容易用归纳法得出。下面只考虑下一个调用:
执行完 InsertionSort(ℎ) 后,如下组已经完成排序:
 后,如下组已经完成排序:
𝐴1,𝐴1+ℎ,𝐴1+2ℎ,…𝐴2,𝐴2+ℎ,𝐴2+2ℎ,…⋮𝐴ℎ,𝐴ℎ+ℎ,𝐴ℎ+2ℎ,…
而之后执行 InsertionSort(𝑘) ,则会将如下组排序:
,则会将如下组排序:
𝐴1,𝐴1+𝑘,𝐴1+2𝑘,…𝐴2,𝐴2+𝑘,𝐴2+2𝑘,…⋮𝐴𝑘,𝐴𝑘+𝑘,𝐴𝑘+2𝑘,…
对于每个 𝑖 (1 ≤𝑖 ≤min(ℎ,𝑘))
 (1 ≤𝑖 ≤min(ℎ,𝑘)) ,考虑如下两个组:
,考虑如下两个组:
𝐴𝑖,𝐴𝑖+𝑘,𝐴𝑖+2𝑘,……,𝐴𝑖+ℎ,𝐴𝑖+ℎ+𝑘,𝐴𝑖+ℎ+2𝑘,…
第二个组前面也加上“… ”的原因是可能 𝑖 +ℎ ≥𝑘
”的原因是可能 𝑖 +ℎ ≥𝑘 从而前面也有元素。
 从而前面也有元素。
则第二个组就是引理 1 中的 𝑋
 中的 𝑋 数组,第一个组就是 𝑌
 数组,第一个组就是 𝑌 数组,𝑙
 数组,𝑙 就是第二个组从 𝑖 +ℎ
 就是第二个组从 𝑖 +ℎ 之后顶到末尾的长度,𝑛
 之后顶到末尾的长度,𝑛 是第二个组中前面那个“…
 是第二个组中前面那个“… ”的长度,𝑚
”的长度,𝑚 是第一个组去掉前 𝑙
 是第一个组去掉前 𝑙 个后剩下的个数。
 个后剩下的个数。
又因为有:
𝐴𝑖≤𝐴𝑖+ℎ,𝐴𝑖+𝑘≤𝐴𝑖+ℎ+𝑘,…
所以由引理 1 可得执行 InsertionSort(𝑘)
 可得执行 InsertionSort(𝑘) 将两个组分别排序后,这个关系依然满足,即依然有 𝐴𝑖 ≤𝐴𝑖+ℎ (1 ≤𝑖 ≤min(ℎ,𝑘))
 将两个组分别排序后,这个关系依然满足,即依然有 𝐴𝑖 ≤𝐴𝑖+ℎ (1 ≤𝑖 ≤min(ℎ,𝑘)) 。
。
若有 𝑖 >min(ℎ,𝑘) ,容易发现取正整数 𝑤
,容易发现取正整数 𝑤 (1 ≤𝑤 ≤min(ℎ,𝑘))
 (1 ≤𝑤 ≤min(ℎ,𝑘)) 再加上若干个 𝑘
 再加上若干个 𝑘 即可得到 𝑖
 即可得到 𝑖 ,则之前的情况已经蕴含了此情况的证明。
,则之前的情况已经蕴含了此情况的证明。
综合以上论述便有:执行完 InsertionSort(𝑘) 依然有 𝐴𝑖 ≤𝐴𝑖+ℎ (1 ≤𝑖 ≤𝑛 −ℎ)
 依然有 𝐴𝑖 ≤𝐴𝑖+ℎ (1 ≤𝑖 ≤𝑛 −ℎ) 。
。
因此定理 1 得证。
这个定理揭示了希尔排序在特定集合 𝐻 下可以优化复杂度的关键,因为在整个过程中,它可以一致保持前面的成果不被摧毁(即 ℎ
 下可以优化复杂度的关键,因为在整个过程中,它可以一致保持前面的成果不被摧毁(即 ℎ 个子列分别有序),从而使后面的调用中,指针 𝑖
 个子列分别有序),从而使后面的调用中,指针 𝑖 的移动次数大大减少。
 的移动次数大大减少。
接下来我们单拎出来一个数论引理进行证明。这个定理在 OI 界因 小凯的疑惑 一题而大为出名。而在希尔排序复杂度的证明中,它也使得定理 1 得到了很大的扩展。
 得到了很大的扩展。
引理 2
 若 𝑎,𝑏 均为正整数且互素,则不在集合 {𝑎𝑥 +𝑏𝑦 ∣𝑥,𝑦 ∈ℕ}
 均为正整数且互素,则不在集合 {𝑎𝑥 +𝑏𝑦 ∣𝑥,𝑦 ∈ℕ} 中的最大正整数为 𝑎𝑏 −𝑎 −𝑏
 中的最大正整数为 𝑎𝑏 −𝑎 −𝑏 。
。
引理 2 证明
 分两步证明:
 - 先证明方程 𝑎𝑥 +𝑏𝑦 =𝑎𝑏 −𝑎 −𝑏 没有 𝑥,𝑦 没有 𝑥,𝑦 均为非负整数的解: 均为非负整数的解:
 - 若无非负整数的限制,容易得到两组解 (𝑏 −1, −1),( −1,𝑎 −1) 。 。
 - 通过其通解形式 𝑥 =𝑥0 +𝑡𝑏,𝑦 =𝑦0 −𝑡𝑎 ,容易得到上面两组解是「相邻」的(因为 𝑏 −1 −𝑏 = −1 ,容易得到上面两组解是「相邻」的(因为 𝑏 −1 −𝑏 = −1 )。 )。
 - 当 𝑡 递增时,𝑥 递增时,𝑥 递增,𝑦 递增,𝑦 递减,所以如果方程有非负整数解,必然会夹在这两组解中间,但这两组解「相邻」,中间没有别的解。 递减,所以如果方程有非负整数解,必然会夹在这两组解中间,但这两组解「相邻」,中间没有别的解。
 - 故不可能有非负整数解。 
- 再证明对任意整数 𝑐 >𝑎𝑏 −𝑎 −𝑏 ,方程 𝑎𝑥 +𝑏𝑦 =𝑐 ,方程 𝑎𝑥 +𝑏𝑦 =𝑐 有非负整数解: 有非负整数解:
 - 我们找一组解 (𝑥0,𝑦0) 满足 0 ≤𝑥0 <𝑏 满足 0 ≤𝑥0 <𝑏 (由通解的表达式,这可以做到)。 (由通解的表达式,这可以做到)。
 - 则有: 𝑏𝑦0=𝑐−𝑎𝑥0≥𝑐−𝑎(𝑏−1)>𝑎𝑏−𝑎−𝑏−𝑎𝑏+𝑎=−𝑏  - 所以 𝑏(𝑦0 +1) >0 ,又因为 𝑏 >0 ,又因为 𝑏 >0 ,所以 𝑦0 +1 >0 ,所以 𝑦0 +1 >0 ,所以 𝑦0 ≥0 ,所以 𝑦0 ≥0 。 。
 - 所以 (𝑥0,𝑦0) 为一组非负整数解。 为一组非负整数解。
 
综上得证。
而下面这个定理则揭示了引理 2 是如何扩展定理 1
 是如何扩展定理 1 的。
 的。
定理 2
 如果 gcd(ℎ𝑡+1,ℎ𝑡) =1 ,则程序先执行完 InsertionSort(ℎ𝑡+1)
,则程序先执行完 InsertionSort(ℎ𝑡+1) 与 InsertionSort(ℎ𝑡)
 与 InsertionSort(ℎ𝑡) 后,执行 InsertionSort(ℎ𝑡−1)
 后,执行 InsertionSort(ℎ𝑡−1) 的时间复杂度为 𝑂(𝑛ℎ𝑡+1ℎ𝑡ℎ𝑡−1)
 的时间复杂度为 𝑂(𝑛ℎ𝑡+1ℎ𝑡ℎ𝑡−1) ,且对于每个 𝑗
,且对于每个 𝑗 ,其 𝑖
,其 𝑖 的移动次数是 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1)
 的移动次数是 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1) 级别的。
 级别的。
定理 2 证明
 对于 𝑗 ≤ℎ𝑡+1ℎ𝑡 的部分,𝑖
 的部分,𝑖 的移动次数显然是是 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1)
 的移动次数显然是是 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1) 级别的。
 级别的。
 故以下假设 𝑗 >ℎ𝑡+1ℎ𝑡 。
。
 对于任意的正整数 𝑘 满足 1 ≤𝑘 ≤𝑗 −ℎ𝑡+1ℎ𝑡
 满足 1 ≤𝑘 ≤𝑗 −ℎ𝑡+1ℎ𝑡 ,注意到:ℎ𝑡+1ℎ𝑡 −ℎ𝑡+1 −ℎ𝑡 <ℎ𝑡+1ℎ𝑡 ≤𝑗 −𝑘 ≤𝑗 −1
,注意到:ℎ𝑡+1ℎ𝑡 −ℎ𝑡+1 −ℎ𝑡 <ℎ𝑡+1ℎ𝑡 ≤𝑗 −𝑘 ≤𝑗 −1
 又因为 gcd(ℎ𝑡+1,ℎ𝑡) =1 ,故由引理 2
,故由引理 2 ,得存在非负整数 𝑎,𝑏
,得存在非负整数 𝑎,𝑏 ,使得:𝑎ℎ𝑡+1 +𝑏ℎ𝑡 =𝑗 −𝑘
,使得:𝑎ℎ𝑡+1 +𝑏ℎ𝑡 =𝑗 −𝑘 。
。
 即得:
 𝑘=𝑗−𝑎ℎ𝑡+1−𝑏ℎ𝑡 
 由定理 1 ,得:
,得:
 𝐴𝑗−𝑏ℎ𝑡≤𝐴𝑗−(𝑏−1)ℎ𝑡≤…≤𝐴𝑗−ℎ𝑡≤𝐴𝑗 
 与
 𝐴𝑗−𝑏ℎ𝑡−𝑎ℎ𝑡+1≤𝐴𝑗−𝑏ℎ𝑡−(𝑎−1)ℎ𝑡+1≤…≤𝐴𝑗−𝑏ℎ𝑡−ℎ𝑡+1≤𝐴𝑗−𝑏ℎ𝑡 
 综合以上既有:𝐴𝑘 =𝐴𝑗−𝑎ℎ𝑡+1−𝑏ℎ𝑡 ≤𝐴𝑗 。
。
 所以对于任何 1 ≤𝑘 ≤𝑗 −ℎ𝑡+1ℎ𝑡 ,有 𝐴𝑘 ≤𝐴𝑗
,有 𝐴𝑘 ≤𝐴𝑗 。
。
 在 Shell-Sort 伪代码中 𝑖 指针每次减 ℎ𝑡−1
 指针每次减 ℎ𝑡−1 ,减 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1)
,减 𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1) 次,即可使得 𝑖 ≤𝑗 −ℎ𝑡+1ℎ𝑡
 次,即可使得 𝑖 ≤𝑗 −ℎ𝑡+1ℎ𝑡 ,进而有 𝐴𝑖 ≤𝐴𝑗
,进而有 𝐴𝑖 ≤𝐴𝑗 ,不满足 while 循环的条件退出。
,不满足 while 循环的条件退出。
 证明完对于每个 𝑗 的移动复杂度后,即可得到总的时间复杂度:
 的移动复杂度后,即可得到总的时间复杂度:
 𝑛∑𝑗=ℎ𝑡−1+1𝑂(ℎ𝑡+1ℎ𝑡ℎ𝑡−1)=𝑂(𝑛ℎ𝑡+1ℎ𝑡ℎ𝑡−1) 
 得证。
认真观察定理 2 的证明过程,可以发现:定理 1 可以进行「线性组合」,即 𝐴
 的证明过程,可以发现:定理 1 可以进行「线性组合」,即 𝐴 以 ℎ
 以 ℎ 为间隔有序,以 𝑘
 为间隔有序,以 𝑘 为间隔亦有序,则以 ℎ
 为间隔亦有序,则以 ℎ 和 𝑘
 和 𝑘 的非负系数线性组合仍是有序的。而这种「线性性」即是由引理 2
 的非负系数线性组合仍是有序的。而这种「线性性」即是由引理 2 保证的。
 保证的。
有了这两个定理,我们可以证明命题 1 与 2
 与 2 。
。
命题 1 证明
 将 𝐻 写为序列的形式:
 写为序列的形式:
 𝐻(ℎ1=1,ℎ2=3,ℎ3=7,…,ℎ⌊log2𝑛⌋=2⌊log2𝑛⌋−1) 
 Shell-Sort 执行顺序为:InsertionSort(ℎ⌊log2𝑛⌋),InsertionSort(ℎ⌊log2𝑛⌋−1),…,InsertionSort(ℎ2),InsertionSort(ℎ1) .
.
 分两部分去分析复杂度:
  综上可得总时间复杂度即为 𝑂(𝑛3/2) 。
。
命题 2 证明
 注意到一个事实:如果已经执行过了 InsertionSort(2) 与 InsertionSort(3)
 与 InsertionSort(3) ,那么因为 2 ⋅3 −2 −3 =1
,那么因为 2 ⋅3 −2 −3 =1 ,所以由定理 2
,所以由定理 2 ,每个元素只有与它相邻的前一个元素可能大于它,之前的元素全部都小于它。于是 𝑖
,每个元素只有与它相邻的前一个元素可能大于它,之前的元素全部都小于它。于是 𝑖 指针只需要最多两次就可以退出 while 循环。也就是说,此时再执行 InsertionSort(1)
 指针只需要最多两次就可以退出 while 循环。也就是说,此时再执行 InsertionSort(1) ,复杂度降为 𝑂(𝑛)
,复杂度降为 𝑂(𝑛) 。
。
 更进一步:如果已经执行过了 InsertionSort(4) 与 InsertionSort(6)
 与 InsertionSort(6) ,我们考虑所有的下标为奇数的元素组成的子列与下标为偶数的元素组成的子列。则这相当于把这两个子列分别执行 InsertionSort(2)
,我们考虑所有的下标为奇数的元素组成的子列与下标为偶数的元素组成的子列。则这相当于把这两个子列分别执行 InsertionSort(2) 与 InsertionSort(3)
 与 InsertionSort(3) 。那么也是一样,这时候再执行 InsertionSort(2)
。那么也是一样,这时候再执行 InsertionSort(2) ,相当于对两个子列分别执行 InsertionSort(1)
,相当于对两个子列分别执行 InsertionSort(1) ,也只需要两个序列和的级别,即 𝑂(𝑛)
,也只需要两个序列和的级别,即 𝑂(𝑛) 的复杂度就可以将数组变为 2
 的复杂度就可以将数组变为 2 间隔有序。
 间隔有序。
 不断归纳,就可以得到:如果已经执行过了 InsertionSort(2ℎ) 与 InsertionSort(3ℎ)
 与 InsertionSort(3ℎ) ,则执行 InsertionSort(ℎ)
,则执行 InsertionSort(ℎ) 的复杂度也只有 𝑂(𝑛)
 的复杂度也只有 𝑂(𝑛) 。
。
 接下来分为两部分分析复杂度:
  综上可得总时间复杂度即为 𝑂(𝑛log2𝑛) 。
。
空间复杂度
希尔排序的空间复杂度为 𝑂(1) 。
。
实现
参考资料与注释
本页面最近更新:2025/9/14 21:22:43,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:NachtgeistW, iamtwz, Alisahhh, CroMarmot, Enter-tainer, HeRaNO, Menci, partychicken, Peanut-Tang, shawlleyw, ShwStone, Tiphereth-A, Xeonacid
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用