qsort函数、sort函数【转】

来源:互联网 发布:饥荒文件修改数据 编辑:程序博客网 时间:2024/06/03 23:46

qsort函数、sort函数 (精心整理篇)

先说明一下qsort和sort,只能对连续内存的数据进行排序,像链表这样的结构是无法排序的。

首先说一下, qsort

qsort(基本快速排序的方法,每次把数组分成两部分和中间的一个划分值,而对于有多个重复值的数组来说,基本快速排序的效率较低,且不稳定)。集成在C语言库函数里面的的qsort函数,使用 三 路划分的方法解决排序这个问题。所谓三路划分,是指把数组划分成小于划分值,等于划分值和大于划分值的三个部分。

 

具体介绍:

void qsort( void *base, size_t num, size_t width, int (__cdecl *compare )

int compare (const void *elem1, const void *elem2 ) );

 

qsort(即,quicksort)主要根据你给的比较条件给一个快速排序,主要是通过指针移动实现排序功能。排序之后的结果仍然放在原来数组中。

参数意义如下:

第一个参数 base 是 需要排序的目标数组名(或者也可以理解成开始排序的地址,因为可以写&s[i]这样的表达式)

第二个参数 num 是 参与排序的目标数组元素个数

第三个参数 width 是单个元素的大小(或者目标数组中每一个元素长度),推荐使用sizeof(s[0])这样的表达式

第四个参数 compare 就是让很多人觉得非常困惑的比较函数啦。

 

我们来简单讨论compare这个比较函数(写成compare是我的个人喜好,你可以随便写成什么,比如 cmp 什么的,在后面我会一直用cmp做解释)。
典型的compare的定义是int compare(const void *a,const void *b);

返回值必须是int,两个参数的类型必须都是const void *,那个a,b是随便写的,个人喜好。假设是对int排序的话,如果是升序,那么就是如果a比b大返回一个正值,小则负值,相等返回0,其他的依次类推,后面有例子来说明对不同的类型如何进行排序。

 

 

qsort 的使用方法:

一、对int类型数组排序

int num[100];

int cmp ( const void *a , const void *b )

{

  return *(int *)a - *(int *)b;  //升序排序

//return *(int *)b - *(int *)a; //降序排序

/*可见:参数列表是两个空指针,现在他要去指向你的数组元素。所以转型为你当前的类型,然后取值。

        升序排列时,若第一个参数指针指向的“值”大于第二个参数指针指向的“值”,则返回正;若第一个参数指针指向的“值”等于第二个参数指针指向的“值”,则返回零;若第一个参数指针指向的“值”小于第二个参数指针指向的“值”,则返回负。

        降序排列时,则刚好相反。

*/

}

qsort(s,n,sizeof(s[0]),cmp);

 

示例完整函数(已在 VC6.0上运行通过):

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
int s[10000],n,i;
int cmp(const void *a,const void *b)
{
return(*(int *)b-*(int *)a);  //实现的是降序排序
}
int main()
{

// 输入想要输入的数的个数
scanf("%d",&n);
for(i=0;i<n;i++)
scanf("%d",&s[i]);
qsort(s,n,sizeof(s[0]),cmp);
for(i=0;i<n;i++)
printf("%d ",s[i]);
return(0);
}

  

二、对char类型数组排序(同int类型)

char word[100];

int cmp( const void *a , const void *b )

{

//注意,网上很多版本是 “ return *(char *)a - *(int *)b;  ” 

//因为编辑者的不用心,盲目copy,以讹传讹,传的一直是错的 *(int *)b

//应该是return *(char *)a - *(char *)b;

return *(char *)a - *(char *)b;

}

qsort(word,100,sizeof(word[0]),cmp);

//附,可能 getchar();  会派上用场 

 

三、对double类型数组排序(特别要注意)

double in[100];

int cmp( const void *a , const void *b )

{

return *(double *)a > *(double *)b ? 1 : -1;

//返回值的问题,显然cmp返回的是一个整型,所以避免double返回小数而被丢失,用一个判断返回值。

}

qsort(in,100,sizeof(in[0]),cmp);

 //附:排序结果的输出,一般建议用 “ %g ” 格式

/* 在这里多嘴一句,"%g"格式输出 虽然书上是说系统会自动选择 " %f " 格式  和 " %e " 格式 中长度较短的格式,并去掉无意义的0,但实际上系统如果选择了" %e ",系统会输出比 “ %e " 格式更省一位的格式输出。(此结论,来自VC6.0的实际操作)*/

 

四、对结构体一级排序

struct In

{

double data;

int other;

}s[100]

 

//按照data的值从小到大将结构体排序,关于结构体内的排序关键数据data的类型可以很多种,参考上面的例子写

 

int cmp( const void *a ,const void *b)

{

return (*(In *)a).data > (*(In *)b).data ? 1 : -1;

//注意,这条语句在VC6.0环境下运行可能会出错,但是并不是语句错了,而是你要先 Build ,或者全部重建。总之语句是对的。

//或者你可以将这上面1条语句改成下面这3条语句

//struct In *aa = (In *)a;
//struct In *bb = (In *)b;
//return aa->data > bb->data ? 1 : -1;

}

qsort(s,100,sizeof(s[0]),cmp);

 

五、对结构体二级排序

struct In

{

int x;   //你可以比喻成:失败次数

int y;   //你可以比喻成:成功次数

}s[100];

 

//按照x从小到大排序,当x相等时按照y从大到小排序。 你可以想象成:失败是主要因素的一个问题,先比较 失败次数少,失败次数相同 再看 成功次数多。

 

int cmp( const void *a , const void *b )

{

struct In *c = (In *)a;

struct In *d = (In *)b;

if(c->x != d->x) return c->x - d->x;

else return d->y - c->y;

}

qsort(s,100,sizeof(s[0]),cmp);

  

六、对字符串进行排序

struct In

{

int data;

char str[100];

}s[100];

//按照结构体中字符串str的字典顺序排序

int cmp ( const void *a , const void *b )

{

return strcmp( (*(In *)a)->str , (*(In *)b)->str );

}

qsort(s,100,sizeof(s[0]),cmp);

 

注意!qsort 中的  cmp 得自己写 。

 

 

再说说   sort (常用于  C++ )

sort 使用时得注明:using namespace std;   或直接打 std::sort()  还得加上  #include <algorithm> 头文件

 

例:

#include<iostream>

#include<algorithm>

using namespace std;

 

int main()

{

       int a[20];

   for(int i=0;i<20;++i)

              cin>>a[i];

 

     sort(a,a+20);             //范围,很明显这里是a+20 注意,这是必要的,如果是a+19

       for(i=0;i<20;i++)        //最后一个值a[19]就不会参与排序。

              cout<<a[i]<<endl;

       return 0;

}

 

std::sort是一个改进版的qsort. std::sort函数优于qsort的一些特点:对大数组采取9项取样,更完全的三路划分算法,更细致的对不同数组大小采用不同方法排序。

 

 

 

最后,我们来说说sort、qsort的区别:

 

sort是qsort的升级版,如果能用sort尽量用sort,使用也比较简单,不像qsort还得自己去写 cmp 函数,只要注明  使用的库函数就可以使用,参数只有两个(如果是普通用法)头指针和尾指针;

 

默认sort排序后是升序,如果想让他降序排列,可以使用自己编的cmp函数

#include<iostream>
#include<algorithm>
using namespace std;
int cmp(int a,int b)
{
  if(a<b)
  return 1; //升序排列,如果改为 a >b,则为降序,要注意sort()中cmp()的返值只有1和0,不像qsort中存在-1!!!!
  else
  return 0;
}


int main(){
    int i;
 int a[20];
 for(int i=0;i<5;++i)
  cin>>a[i];

sort(a,a+5,cmp);          //范围,很明显这里是a+5 注意,这是必要的,如果是a+4最后一个值a[4]就不会参与排序。
for(i=0;i<5;i++)       

cout<<a[i]<<endl;
    system("pause");
 return 0;
}

 

对二维数组的排序:
#include <iostream>
#include <algorithm>
#include <ctime>
using namespace std;

bool cmp(int *p,int *q)
{
    if(p[0]==q[0])
    {
        if(p[1]==q[1])
        {
            return p[2]<q[2];
        }
        else return p[1]<q[1];
    }
    else return p[0]<q[0];
}
int main()
{
    srand(time(0));
    int i;
    int **a=new int*[1000];
    for(i=0;i<1000;++i)
    {
        a[i]=new int[3];
        a[i][0]=rand()%1000;
        a[i][1]=rand()%1000;
        a[i][2]=rand()%1000;
        //printf("%d\t%d\t%d\n",a[i][0],a[i][1],a[i][2]);
    }
    sort(a,a+1000,cmp);
    /*cout<<"After sort"<<endl;
    for(i=0;i<1000;++i)
    {
        printf("%d\t%d\t%d\n",a[i][0],a[i][1],a[i][2]);
    }*/
    return 0;
}

 

所以呢,有事没事,咱们也可以看看 C++ .

————————————————————————————————————————————————

—————————————————————分割线————————————————————————

————————————————————————————————————————————————

int cmp(const void *a, const void *b)

返回正数就是说 cmp 传入参数第一个要放在第二个后面, 负数就是传入参数第一个要放第二个前面, 如果是 0, 那就无所谓谁前谁后..

下面就把snoopy曾经写的介绍qsort的完整版贴出来好了,我想有与我一样经历的朋友也可以弄懂的:

很多人问这个东西.我以前也看了好久,今天翻到以前学快排的时候写的练习code,基本上
能覆盖绝大部分用法了.

里面有很多地方没判断相等的情况,按道理来说相等情况下应该返回0的,这个请看代码的
时候注意.我尽量保证代码不出错了.

下面的这些说明和问题都是个人原创,没查什么资料,所以不保证其完全正确性,在此表示个
人不对出现的问题负任何责任,大家WA了或者干吗的不要怪我,不过至少目前来说我用起来
是没问题的 :)

/*----------------------------------------------------------------------------*/

** 关于快排函数的一些说明 **

qsort,包含在stdlib.h头文件里,函数一共四个参数,没返回值.一个典型的qsort的写法如下

qsort(s,n,sizeof(s[0]),cmp);

其中第一个参数是参与排序的数组名(或者也可以理解成开始排序的地址,因为可以写&s[i]
这样的表达式,这个问题下面有说明); 第二个参数是参与排序的元素个数; 第三个三数是
单个元素的大小,推荐使用sizeof(s[0])这样的表达式,下面也有说明 :) ;第四个参数就是
很多人觉得非常困惑的比较函数啦,关于这个函数,还要说的比较麻烦...

我们来讨论cmp这个比较函数(写成cmp是我的个人喜好,你可以随便写成什么,比如qcmp什么
的).典型的cmp的定义是

int cmp(const void *a,const void *b);

返回值必须是int,两个参数的类型必须都是const void *,那个a,b是我随便写的,个人喜好.
假设是对int排序的话,如果是升序,那么就是如果a比b大返回一个正值,小则负值,相等返回
0,其他的依次类推,后面有例子来说明对不同的类型如何进行排序.

在函数体内要对a,b进行强制类型转换后才能得到正确的返回值,不同的类型有不同的处理
方法.具体情况请参考后面的例子.

/*----------------------------------------------------------------------------*/

** 关于快排的一些小问题 **

1.快排是不稳定的,这个不稳定一个表现在其使用的时间是不确定的,最好情况(O(n))和最
坏情况(O(n^2))差距太大,我们一般说的O(nlog(n))都是指的是其平均时间.

2.快排是不稳定的,这个不稳定表现在如果相同的比较元素,可能顺序不一样,假设我们有
这样一个序列,3,3,3,但是这三个3是有区别的,我们标记为3a,3b,3c,快排后的结果不一定
就是3a,3b,3c这样的排列,所以在某些特定场合我们要用结构体来使其稳定(No.6的例子就
是说明这个问题的)

3.快排的比较函数的两个参数必须都是const void *的,这个要特别注意,写a和b只是我的
个人喜好,写成cmp也只是我的个人喜好.推荐在cmp里面重新定义两个指针来强制类型转换,
特别是在对结构体进行排序的时候

4.快排qsort的第三个参数,那个sizeof,推荐是使用sizeof(s[0])这样,特别是对结构体,
往往自己定义2*sizeof(int)这样的会出问题,用sizeof(s[0)既方便又保险

5.如果要对数组进行部分排序,比如对一个s[n]的数组排列其从s[i]开始的m个元素,只需要
在第一个和第二个参数上进行一些修改:qsort(&s[i],m,sizeof(s[i]),cmp);

/*----------------------------------------------------------------------------*/

** 标程,举例说明 **

No.1.手工实现QuickSort

复制代码
#include <stdio.h>int a[100],n,temp;void QuickSort(int h,int t){     if(h>=t) return;     int mid=(h+t)/2,i=h,j=t,x;     x=a[mid];     while(1)     {         while(a[i]<x) i++;         while(a[j]>x) j--;         if(i>=j) break;         temp=a[i];         a[i]=a[j];         a[j]=temp;     }     a[mid]=a[j];     a[j]=x;     QuickSort(h,j-1);     QuickSort(j+1,t);     return;}int main(){     int i;     scanf("%d",&n);     for(i=0;i<n;i++) scanf("%d",&a[i]);     QuickSort(0,n-1);     for(i=0;i<n;i++) printf("%d ",a[i]);     return(0);}
复制代码

 



No.2.最常见的,对int数组排序

复制代码
#include <stdio.h>#include <string.h>#include <stdlib.h>int s[10000],n,i;int cmp(const void *a, const void *b){     return(*(int *)a-*(int *)b);}int main(){     scanf("%d",&n);     for(i=0;i<n;i++) scanf("%d",&s[i]);         qsort(s,n,sizeof(s[0]),cmp);         for(i=0;i<n;i++) printf("%d ",s[i]);         return(0);}
复制代码

 



No.3.对double型数组排序,原理同int

这里做个注释,本来是因为要判断如果a==b返回0的,但是严格来说,两个double数是不可能相等的,只能说fabs(a-b)<1e-20之类的这样来判断,所以这里只返回了1和-1

复制代码
#include <stdio.h>#include <stdlib.h>double s[1000];int i,n;int cmp(const void * a, const void * b){     return((*(double*)a-*(double*)b>0)?1:-1);}int main(){     scanf("%d",&n);     for(i=0;i<n;i++) scanf("%lf",&s[i]);         qsort(s,n,sizeof(s[0]),cmp);         for(i=0;i<n;i++) printf("%lf ",s[i]);         return(0);}
复制代码

 



No.4.对一个字符数组排序.原理同int

复制代码
#include <stdio.h>#include <string.h>#include <stdlib.h>char s[10000],i,n;int cmp(const void *a,const void *b){     return(*(char *)a-*(char *)b);}int main(){     scanf("%s",s);     n=strlen(s);     qsort(s,n,sizeof(s[0]),cmp);         printf("%s",s);     return(0);}
复制代码

 


No.5.对结构体排序

注释一下.很多时候我们都会对结构体排序,比如校赛预选赛的那个樱花,一般这个时候都在
cmp函数里面先强制转换了类型,不要在return里面转,我也说不清为什么,但是这样程序会
更清晰,并且绝对是没错的. 这里同样请注意double返回0的问题

复制代码
#include <stdio.h>#include <stdlib.h>struct node{     double date1;     int no;} s[100];int i,n;int cmp(const void *a,const void *b){     struct node *aa=(node *)a;     struct node *bb=(node *)b;     return(((aa->date1)>(bb->date1))?1:-1);}int main(){     scanf("%d",&n);     for(i=0;i<n;i++)     {         s[i].no=i+1;         scanf("%lf",&s[i].date1);     }     qsort(s,n,sizeof(s[0]),cmp);         for(i=0;i<n;i++) printf("%d   %lf\n",s[i].no,s[i].date1);         return(0);}
复制代码

 



No.6.对结构体排序.加入no来使其稳定(即data值相等的情况下按原来的顺序排)

复制代码
#include <stdio.h>#include <stdlib.h>struct node{     double date1;     int no;} s[100];int i,n;int cmp(const void *a,const void *b){     struct node *aa=(node *)a;     struct node *bb=(node *)b;     if(aa->date1!=bb->date1)         return(((aa->date1)>(bb->date1))?1:-1);     else         return((aa->no)-(bb->no));}int main(){     scanf("%d",&n);     for(i=0;i<n;i++)     {         s[i].no=i+1;         scanf("%lf",&s[i].date1);     }     qsort(s,n,sizeof(s[0]),cmp);     for(i=0;i<n;i++) printf("%d   %lf\n",s[i].no,s[i].date1);     return(0);}
复制代码

 


No.7.对字符串数组的排序(char s[][]型)

复制代码
#include <stdio.h>#include <string.h>#include <stdlib.h>char s[100][100];int i,n;int cmp(const void *a,const void *b){     return(strcmp((char*)a,(char*)b));}int main(){     scanf("%d",&n);     for(i=0;i<n;i++) scanf("%s",s[i]);         qsort(s,n,sizeof(s[0]),cmp);         for(i=0;i<n;i++) printf("%s\n",s[i]);         return(0);}
复制代码

 



No.8.对字符串数组排序(char *s[]型)

复制代码
#include <stdio.h>#include <string.h>#include <stdlib.h>char *s[100];int i,n;int cmp(const void *a,const void *b){     return(strcmp(*(char**)a,*(char**)b));}int main(){     scanf("%d",&n);     for(i=0;i<n;i++)     {         s[i]=(char*)malloc(sizeof(char*));         scanf("%s",s[i]);     }     qsort(s,n,sizeof(s[0]),cmp);     for(i=0;i<n;i++) printf("%s\n",s[i]);     return(0);}
复制代码

 

9、计算几何中求凸包的cmp

复制代码
int cmp(const void *a, const void *b){    TPoint *c = (TPoint *)a;    TPoint *d = (TPoint *)b;    double k = multi(*c, *d, point[0]); //p0c×p0d (若>0 说明c的极角小于d, 若<0, c的极角大于d)    if( k< 0) return 1;                              // 若前面的大于后面的,返回1--- 表示升序(交换)    else if(k == 0 && distance(*c, point[0]) >= distance(*d, point[0]))           return 1;                                      // 把距离远的丢在后面,这么做扫描时才可以删掉近的    else return -1;   }
复制代码

 


0 0