Skip to content

Latest commit

 

History

History
168 lines (117 loc) · 9.19 KB

2013-03-06-sort-about-merge-sort.md

File metadata and controls

168 lines (117 loc) · 9.19 KB
layout title date tags
post
[Sort] 淺談 merge sort
2013-03-06
ACM-ICPC
sort | 排序
algorithm | 演算法

中譯「合併排序法」,這次要介紹的可是個高效演算法,雖然在小量資料時可能不見得有明顯優勢,但資料量一大即可發現極大的差距!

Merge sort 採用 divide & conquer 的策略,該策略是不斷地將原數列剖半分為兩個較小的數列,並將兩個較小的數列排序好在進行合併。至於怎麼排序那兩個較小的數列呢?採用相同的策略,把數列在分為兩個較小的數列,並在排序好後進行合併!那麼,該剖半到什麼時候呢?其實切到數列只剩下一個元素在停止就好,因為當數列僅有一個元素時,就已經是個有序數列了,也就可回傳給上一個問題去進行合併!

於是,切割數列應該不成問題了,最大的問題就是合併了,這也是 merge sort 關鍵的地方,也是為什麼叫做 merge sort 的原因了!在取得兩個有序的數列後,進行合併的方式為同時枚舉兩數列內的元素,並進行比較後將較小的數值放入原數列中,持續該步驟直到枚舉過所有元素!具體的演算法流程,以下分為切割與合併兩個部分:

Divide

  1. 將數列對半切割
  2. 持續切割至數列僅剩一個元素

Conquer

  1. 當數列僅剩一個元素時即回傳
  2. 當數列不僅一個元素時,切割後待子數列排序完成
  3. 取得兩個有序子數列後,利用兩個指標指向該兩個子數列的起始元素
  4. 比較兩指標所指到的值,並將較小者放入原數列,並將指標指向下一個元素
  5. 若某一個指標已指到數列結尾,則按照順序將另一個子數列剩餘的元素放到原數列中
  6. 持續以上步驟即可排序完成

時間與空間複雜度

先來看時間複雜度,並從切割的部份開始,這部份根據實作會有所不同。如果從頭到尾都使用同一個陣列空間(例如:使用 global variable),且參數傳遞時僅傳送頭尾 index 值,那麼切割的時間複雜度僅為 O(1),直接將 index 相加除以 2 就可以得到切割位置的 index。若是每次切割都申請新的記憶體空間,則切割的時間複雜度為 O(n),因為需要遍歷所有元素且放入新的子數列中。至於合併的部分,合併是將兩個切割後的子數列進行合併,且枚舉比較兩子數列中的元素。因此每個元素都將被遍歷過,使得時間複雜度也為 O(n)。我們即可知道每一個遞迴式扣除排序子數列的時間的話,其時間複雜度為 O(n)。

那麼接下來要計算的是,遞迴式會執行幾次?詳細證明我不會,基本上就是計算 n 一直除以 2,除幾次會等於 1。反過來想 1 要乘以 2 幾次會等於 n,這應該很好理解,所以方程式就是 2x = n,求解 x 就可以得到 x = log2n。因此遞迴式最多也只會執行 log2n 次,配合上每次遞迴式所執行的時間,即可得到時間複雜度為 O(nlog2n)。

在空間複雜度上,一樣先從切割的部份開始,若每次遞迴式都使用相同的數列空間,那麼在切割時不需要額外申請空間,所以時間複雜度為 O(1)。若是每次都替子數列申請新的記憶體空間,那麼空間複雜度就為 O(n)。而在合併的部份,如果從頭到尾都使用相同的數列空間,但在合併時為了避免覆蓋還未比較的元素,勢必也需要另外申請一個長度為 n 的數列空間以存放合併結果,因此空間複雜度為 O(n)。若是有替子數列申請記憶體空間的話,在合併時就可以使用原來的數列空間,空間複雜度即為 O(1),因此每個遞迴式的空間複雜度皆為 O(n)。前面也算過了遞迴式會執行 log2 次,所以空間複雜度為 O(nlog2n)。

優化 merge sort

Natural Merge Sort

這邊介紹一個改進的方法,稱之為 natural merge sort。除了完全逆序的狀況外,該作法是利用數列內已存在的有序數列片段來減少切割的次數。若已知一個數列已有序,則該數列不需要再遞迴進行 merge sort 了,如此一來即可減少遞迴式的呼叫次數。而 natural merge sort 跟一般的 merge sort 的差異僅在切割的部份,合併部分皆相同。以下是其切割的演算法:

  1. 申請兩個新的數列空間,分別稱為 A 與 B,並設定數列 A 為使用中數列
  2. 依序遍歷數列元素,並將元素放入使用中數列
  3. 一旦當前遍歷的元小於上一個元素時,將使用中數列換為另一個數列,並將該元素放入
  4. 不斷的重複步驟 2 與步驟 3 直到所有元素被遍歷,並分配到子數列
  5. 若是切割後的子數列 A 與 B 中有任一個為空,表示原數列已有序,則不需在遞迴排序子數列
  6. 若子數列 A 與 B 皆不為空,則繼續遞迴排序

可以發現這樣的作法理論上可以省去許多的遞迴呼叫,除非完全逆序才有可能發生切割到一塊的狀況,否則幾乎都可以提前回傳不需要再進一步切割排序。

pseudo code

Tradition Merge Sort

function merge_sort( A ):
    if length( A ) == 1
        return

    // divide
    mid = length( A ) / 2
    left = A[ i, mid )
    right = A[ mid, length( A ) ]

    merge_sort( left )
    merge_sort( right )

    // merge
    for i in [ 0, n )
        if left is empty
            A[ i ] = first( right )
            right = rest( right )
        else if right is empty
            A[ i ] = first( left )
            left = rest( left )
        else if first( left ) is less than first( right )
            A[ i ] = first( left )
            left = rest( left )
        else
            A[ i ] = first( right )
            right = rest( right )

    return

Natural Merge Sort

這邊我僅僅寫出切割的部分,合併的部分都僅用 merge 表示:

function naturalMergeSort( A ):
    B, C are empty sequence
    CUR refer to B

    LAST = A[ 0 ]

    while A is not  empty
        if first( A ) >= LAST
            append first(A) to CUR
            LAST = first( A )
            A = rest( A )
        else
            if CUR refer to B
                CUR refer to C
            else
                CUR refer to B
            LAST = first( A )

    if B is empty or C is empty
        return

    naturalMergeSort( B )
    naturalMergeSort( C )

    A = merge( B, C )

Source Code

Tradition Merge Sort

<script src="https://gist.github.com/KuoE0/5091967.js?file=mergeSort.cpp"></script>

Source code on gist.

Natural Merge Sort

<script src="https://gist.github.com/KuoE0/5091967.js?file=mergeSort-natural.cpp"></script>

Source code on gist.

效能比較

雖然拿時間複雜度 O(nlog2n) 跟 O(n2) 的比實在不公平,但還是拿 O(n2) 中最快的 insertion sort 來比較好了!

compare

資料數量 insertion sort merge sort natural merge sort
50 0.01 0.01 0.01
100 0.01 0.02 0.03
500 0.16 0.09 0.14
1000 0.60 0.18 0.29
2500 3.55 0.47 0.76
5000 x 0.98 1.55
7500 x 1.37 2.18
10000 x 2.06 3.17
100 * x 0.18 0.09
1000 * x 0.22 0.11
10000 * x 1.91 0.76

以上測試資料皆為 100 組,單位為秒 (second),其中有星號的測試資料表示數列本身是由多組有序數列組成。欄位中標示 x 表示數值與其它欄位差異過大,為了避免圖表因該數據使得上現過大,而無法觀察細微部分,故移除該資料。

除了少於等於 100,發現有給 insertion sort 略勝的機會,但從 500 以後漸漸的可以發現 insertion sort 完全被虐爆。相信大家都可以感覺到 O(nlog2n) 與 O(n2) 得明顯差異了,並且隨著 n 的增長,效能的增進也更加明顯!

在表中可以發現 natural merge sort 似乎沒有預期的表現較佳,反而慘敗!!推估是在切割時耗費太多時間在進行比較,不像一般的 merge sort 直接對半切割,不需要進行任何比較操作。但在另一些特別設計為多組有序數列組成的測試資料中,即可發現 natural merge sort 還是有著顯著的效能增進!可惜大部份亂序資料的狀況下,要有多組有序數列組成的狀況可能就較少了。

以下的投影片中有 merge sort 的執行過程,有興趣可以前往參考!

<script async class="speakerdeck-embed" data-id="2c4cff1067f301306a3822000a1f8082" data-ratio="1.33333333333333" src="//speakerdeck.com/assets/embed.js"></script>

Slide on Speaker Deck.

相關資料

Wikipedia 上的示意動畫:

merge sort