Fork/Join 快速排序框架比普通快速排序执行时间更长
Fork/Join framework for quicksort execute longer than normal quicksort
我把fork/join快速排序和普通快速排序合二为一class然后我计算了执行这两个的时间。奇怪的是 fork/join 比正常的快速排序工作的时间更长。问题是为什么?
主要
public class Main
{
public static void main(String[] args)
{
Random generator = new Random();
List<Integer> list = new ArrayList<>(50000);
for(int i = 0; i < 50000; i ++)
{
list.add(generator.nextInt(500200));
}
List<Integer> list2 = new ArrayList<>(list);
ConcurrentQuickSort<Integer> sort = new ConcurrentQuickSort<>(list,0,list.size() - 1);
long startTime = System.currentTimeMillis();
ForkJoinPool pool = new ForkJoinPool();
pool.invoke(sort);
pool.shutdown();
pool.awaitTermination(10,TimeUnit.SECONDS);
long endTime = System.currentTimeMillis();
long ConcurrentTime = (endTime - startTime);
startTime = System.currentTimeMillis();
ConcurrentQuickSort<Integer> sort2 = new ConcurrentQuickSort<>(list2,0,list.size() - 1);
sort2.doSort(0,list2.size() - 1);
endTime = System.currentTimeMillis();
long sequentialTime = (endTime - startTime);
System.out.println(ConcurrentTime);
System.out.println(sequentialTime);
System.out.println(sort2.isCorrect(list));
}
}
并发快速排序
public class ConcurrentQuickSort<T extends Comparable<T> > extends RecursiveAction
{
private List<T> list;
private int size;
private int begin;
private int end;
public ConcurrentQuickSort(List<T> list,int begin,int end)
{
this.list = list;
this.size = this.list.size();
this.begin = begin;
this.end = end;
}
private int partition(int begin, int end)
{
T x = list.get(begin);
int i = begin;
int j = end;
while(true)
{
while(list.get(j).compareTo(x) > 0)
{
j--;
}
while(list.get(i).compareTo(x) < 0)
{
i++;
}
if(i < j)
{
swap(i,j);
i++;
j--;
}
else
return j;
}
}
public void doSort(int begin, int end)
{
int q;
if(begin < end)
{
q = partition(begin,end);
doSort(begin,q);
doSort(q + 1,end);
}
}
public void doSort()
{
}
public void sort()
{
doSort(0,list.size() - 1);
}
private void swap(int first, int second)
{
T temp = list.get(first);
list.set(first,list.get(second));
list.set(second,temp);
}
@Override
protected void compute()
{
int q;
if(begin < end)
{
q = partition(begin,end);
List<ConcurrentQuickSort<T>> subtasks = splitWork(q);
for(ConcurrentQuickSort<T> t : subtasks)
{
t.fork();
}
}
}
private List<ConcurrentQuickSort<T>> splitWork(int q)
{
List<ConcurrentQuickSort<T>> subtasks = new ArrayList<>();
subtasks.add(new ConcurrentQuickSort<>(this.list,begin,q));
subtasks.add(new ConcurrentQuickSort<>(this.list,q +1,end));
return subtasks;
}
public boolean isCorrect(List<T> other)
{
return list.equals(other);
}
}
执行普通快速排序的时间大约是 20 毫秒和 fork/join 80。为什么?
对于足够小的数据集:
- 不同线程之间同步数据的代价会超过并行的好处
- 多个线程将在彼此非常接近的内存范围内工作,以至于它们将被缓存在每个核心的 L1 缓存中,这意味着缓存的使用效率较低(当它实际上在另一个核心的缓存中)
- 冒泡排序实际上会优于快速排序,因为即使 O(n^2) > O(n log n),进行递归调用的成本将超过额外的 O-complexity 冒泡排序
如果您实施较低的阈值,在并发和 non-concurrent 快速排序之间以及在快速排序和冒泡排序之间切换,您可能能够计算出不同 cpu-caches 的行大小和算法。
RecursiveAction 的 javadoc 显示了阈值设置为 1000 的合并排序的实现。
我把fork/join快速排序和普通快速排序合二为一class然后我计算了执行这两个的时间。奇怪的是 fork/join 比正常的快速排序工作的时间更长。问题是为什么?
主要
public class Main
{
public static void main(String[] args)
{
Random generator = new Random();
List<Integer> list = new ArrayList<>(50000);
for(int i = 0; i < 50000; i ++)
{
list.add(generator.nextInt(500200));
}
List<Integer> list2 = new ArrayList<>(list);
ConcurrentQuickSort<Integer> sort = new ConcurrentQuickSort<>(list,0,list.size() - 1);
long startTime = System.currentTimeMillis();
ForkJoinPool pool = new ForkJoinPool();
pool.invoke(sort);
pool.shutdown();
pool.awaitTermination(10,TimeUnit.SECONDS);
long endTime = System.currentTimeMillis();
long ConcurrentTime = (endTime - startTime);
startTime = System.currentTimeMillis();
ConcurrentQuickSort<Integer> sort2 = new ConcurrentQuickSort<>(list2,0,list.size() - 1);
sort2.doSort(0,list2.size() - 1);
endTime = System.currentTimeMillis();
long sequentialTime = (endTime - startTime);
System.out.println(ConcurrentTime);
System.out.println(sequentialTime);
System.out.println(sort2.isCorrect(list));
}
}
并发快速排序
public class ConcurrentQuickSort<T extends Comparable<T> > extends RecursiveAction
{
private List<T> list;
private int size;
private int begin;
private int end;
public ConcurrentQuickSort(List<T> list,int begin,int end)
{
this.list = list;
this.size = this.list.size();
this.begin = begin;
this.end = end;
}
private int partition(int begin, int end)
{
T x = list.get(begin);
int i = begin;
int j = end;
while(true)
{
while(list.get(j).compareTo(x) > 0)
{
j--;
}
while(list.get(i).compareTo(x) < 0)
{
i++;
}
if(i < j)
{
swap(i,j);
i++;
j--;
}
else
return j;
}
}
public void doSort(int begin, int end)
{
int q;
if(begin < end)
{
q = partition(begin,end);
doSort(begin,q);
doSort(q + 1,end);
}
}
public void doSort()
{
}
public void sort()
{
doSort(0,list.size() - 1);
}
private void swap(int first, int second)
{
T temp = list.get(first);
list.set(first,list.get(second));
list.set(second,temp);
}
@Override
protected void compute()
{
int q;
if(begin < end)
{
q = partition(begin,end);
List<ConcurrentQuickSort<T>> subtasks = splitWork(q);
for(ConcurrentQuickSort<T> t : subtasks)
{
t.fork();
}
}
}
private List<ConcurrentQuickSort<T>> splitWork(int q)
{
List<ConcurrentQuickSort<T>> subtasks = new ArrayList<>();
subtasks.add(new ConcurrentQuickSort<>(this.list,begin,q));
subtasks.add(new ConcurrentQuickSort<>(this.list,q +1,end));
return subtasks;
}
public boolean isCorrect(List<T> other)
{
return list.equals(other);
}
}
执行普通快速排序的时间大约是 20 毫秒和 fork/join 80。为什么?
对于足够小的数据集:
- 不同线程之间同步数据的代价会超过并行的好处
- 多个线程将在彼此非常接近的内存范围内工作,以至于它们将被缓存在每个核心的 L1 缓存中,这意味着缓存的使用效率较低(当它实际上在另一个核心的缓存中)
- 冒泡排序实际上会优于快速排序,因为即使 O(n^2) > O(n log n),进行递归调用的成本将超过额外的 O-complexity 冒泡排序
如果您实施较低的阈值,在并发和 non-concurrent 快速排序之间以及在快速排序和冒泡排序之间切换,您可能能够计算出不同 cpu-caches 的行大小和算法。
RecursiveAction 的 javadoc 显示了阈值设置为 1000 的合并排序的实现。