Hollerith 的基数排序

Hollerith's Radix Sort

我已经实现了普通的基数排序:

#include <iostream>

using namespace std;

void print(int arr[], int n) {
    for (int i = 0; i < n; i++) {
        cout << arr[i] << " ";
    }
    cout << endl;
}

int findMax(int arr[], int n) {
    int mx = 0;
    for (int i = 0; i < n; i++) {
        if (arr[i] > mx)
            mx = arr[i];
    }
    return mx;
}

void countingSort(int arr[], int n, int exp) {
    int output[n];
    const int m = findMax(arr, n) + 1;
    int C[m];
    for (int i = 0; i < m; i++) {
        C[i] = 0;
    }

    for (int i = 0; i < n; i++)
        C[(arr[i] / exp) % 10]++;

    for (int i = 1; i < 10; i++)
        C[i] += C[i - 1];

    for (int i = n - 1; i >= 0; i--) {
        output[C[(arr[i] / exp) % 10] - 1] = arr[i];
        C[(arr[i] / exp) % 10]--;
    }

    for (int i = 0; i < n; i++)
        arr[i] = output[i];
}

void radixSotr(int arr[], int n) {
    int m = findMax(arr, n);
    for (int exp = 1; m / exp > 0; exp *= 10) {
        countingSort(arr, n, exp);
    }
}

int main() {
    int n;
    cout << "Enter the number of elements: ";
    cin >> n;
    int arr[n];
    cout << "Enter the elements of the array: ";
    for (int i = 0; i < n; i++) {
        cin >> arr[i];
    }
    cout << endl;
    cout << "Unsorted version of the array: " << endl;
    print(arr, n);
    cout << endl;
    cout << "Sorted version of the array: " << endl;
    radixSotr(arr, n);
    print(arr, n);

    return 0;
}

现在我正在尝试实现 Hollerith 版本的基数排序,其中基数排序从最高有效位开始并迭代传播到最低有效位。你能给我一些修改代码的想法吗,因为我被卡住了。

你的countingSort函数有问题:

  • 您应该使用 10 个索引数组进行计数,而不是查找最大元素并声明 int C[m]。您当前的代码在自动存储中分配了一个潜在的巨大数组,调用了未定义的行为。

这是更正后的版本:

void countingSort(int arr[], int n, int exp) {
    int output[n];
    int C[10] = { 0 };

    for (int i = 0; i < n; i++)
        C[(arr[i] / exp) % 10]++;

    for (int i = 1; i < 10; i++)
        C[i] += C[i - 1];

    for (int i = n - 1; i >= 0; i--) {
        output[--C[(arr[i] / exp) % 10]] = arr[i];
        C[(arr[i] / exp) % 10]--;
    }

    for (int i = 0; i < n; i++)
        arr[i] = output[i];
}

请注意,此算法无法对包含负数的数组进行排序。

Hollerith 算法使用最低有效位到最高有效位。它的发明是为了使用制表机对打孔卡片上的美国人口普查数据进行分类。这是一个 非常 的早期数据处理计算示例,可追溯到 1887。打孔卡一直使用两种不同的字符编码方案,称为 H 码和 T 码,H 代表 Herman Hollerith,这些分拣机的发明者,于 1929 年去世。(参见 http://ed-thelen.org/comp-hist/Knuth-Sort.html )

对于从最高有效位到最低有效位,您需要递归,而不是像您拥有的那样的迭代方法:

  • 找到最大值,从而得到最高有效数字的最大指数。
  • 按照当前位数对数组进行排序
  • 对于当前位置具有相同数字的每个元素桶:
    • 如果桶是空的或只有一个元素,则排序
    • 否则,使用 exp/10.
    • 在桶上递归下一个较小的数字

你可以用任何 >= 2 的基数来做这个。