Rambling Jim: April 2012

Monday, April 30, 2012

快排、堆排对于随机数据的效率测试

放假期间无所事事，决定回顾一下快速排序和堆排序。
自从转C后，快排都用qsort解决，去年参加CCF培训的时候有些选手说stdlib里面的qsort效率低，自己写更好。
堆排序实际并不常用，除非用于一些变动频繁的数据，例如dijstra算法中的最小堆优化。
堆排和快排的时间复杂度都是O(nlogn)，但这并不代表它们的实际效率是相同的，于是就有了下面的测试。

先介绍下环境：CPU~Dual core Intel Core i3 CPU M 370 (-HT-MCP-) clocked at 933.000 Mhz Kernel~3.0.0-17-generic x86_64 Up~4:08 Mem~674.2/3760.7MB HDD~320.1GB(44.1% used) Procs~181 Client~Shell inxi~1.7.7
首先，随机生成10000000个数字，存到rand.txt

然后，用下面的代码测试：

C语言: 高亮代码由发芽网提供

#include 

#include 

#include 

#include 

#define MAXN 10000000



long num[MAXN];

long bak[MAXN];

long heapsize;



long lc(long k)

{

    return 2 * k + 1;

}



long rc(long k)

{

    return 2 * k + 2;

}



long p(long k)

{

    return (k - 1) >> 1;

}



void read()

{

    long i;

    for(i = 0;i < MAXN;i ++)

        scanf("%ld",&num[i]);

}



void pt()

{

    long i;

    for(i = 0;i < MAXN;i ++)

        printf("%ld\n",num[i]);

}



int cmp(const void *a,const void *b)

{

    return *(long *)a > *(long *)b;

}



void quicksort(long l,long r)

{

    if(l < r)

    {

    long mid,key,tmp,i,j;

    mid = (l + r) >> 1;

    key = num[mid];num[mid] = num[r];num[r] = key;

    for(i = j = l;i < r;i ++)

    {

        if(num[i] < key)

        {

            tmp = num[i];

            num[i] = num[j];

            num[j] = tmp;

            j ++;

        }

    }

    num[r] = num[j];

    num[j] = key;

    quicksort(l,j - 1);

    quicksort(j + 1,r);

    }

}



void quicksort_rand(long l,long r)

{

    if(l < r)

    {

    long mid,key,tmp,i,j;

    mid = rand() % (r - l) + l;

    key = num[mid];num[mid] = num[r];num[r] = key;

    for(i = j = l;i < r;i ++)

    {

        if(num[i] < key)

        {

            tmp = num[i];

            num[i] = num[j];

            num[j] = tmp;

            j ++;

        }

    }

    num[r] = num[j];

    num[j] = key;

    quicksort(l,j - 1);

    quicksort(j + 1,r);

    }

}



void heapfy(int k)

{

    long min,tmp;

    min = k;

    if(lc(k) < heapsize && num[lc(k)] < num[min])    min = lc(k);

    if(rc(k) < heapsize && num[rc(k)] < num[min])    min = rc(k);

    if(min != k)

    {

        tmp = num[min];

        num[min] = num[k];

        num[k] = tmp;

        heapfy(min);

    }

}



long extract_min()

{

    long min = num[0];

    num[0] = num[--heapsize];

    heapfy(0);

    return min;

}



void heapsort()

{

    long i;

    for(i = MAXN / 2;i >= 0;i --)

        heapfy(i);

    while(heapsize >= 1)

    {

        i = extract_min();

        //printf("%ld\n",i);

    }

}



void create()

{

    FILE *out;

    out = fopen("rand.txt","w");

    long i;

    srand(time(NULL));

    for(i = 0;i < MAXN;i ++)

        fprintf(out,"%d\n",rand());

    exit(0);

}



int main()

{

    clock_t start,end;

    //create();

    read();

    memcpy(bak,num,sizeof(num));

    start = clock();

    qsort(num,MAXN,sizeof(long),cmp);

    end = clock();

    //pt();

    fprintf(stderr,"Biult-in qsort:%f\n",(double)(end - start) / CLOCKS_PER_SEC);



    memcpy(num,bak,sizeof(num));

    start = clock();

    quicksort(0,MAXN - 1);

    end = clock();

    fprintf(stderr,"My QuickSort:%f\n",(double)(end - start) / CLOCKS_PER_SEC);

    //pt();

    

    memcpy(num,bak,sizeof(num));

    start = clock();

    quicksort_rand(0,MAXN - 1);

    end = clock();

    fprintf(stderr,"My QuickSort(Rand):%f\n",(double)(end - start) / CLOCKS_PER_SEC);

    //pt();

    

    memcpy(num,bak,sizeof(num));

    start = clock();

    heapsize = MAXN;

    heapsort();

    end = clock();

    fprintf(stderr,"HeapSort:%f\n",(double)(end - start) / CLOCKS_PER_SEC);

    return 0;

}

当MAXN定义为1000000时，输出如下：

Biult-in qsort:0.250000

My QuickSort:0.240000

My QuickSort(Rand):0.230000

HeapSort:0.830000

当MAXN达到10000000时：

Biult-in qsort:3.010000

My QuickSort:2.640000

My QuickSort(Rand):2.640000

HeapSort:13.430000

整体上，可以看出，对于随机数据，单次排序，快排的表现明显优于推排序。个人推测原因是堆排序存在建堆、弹出小元素和维护堆三个过程，因此耗时会多一些。

对于快速排序，qsort使用方便，效率略低。自己写的随机化快排速度最快。不过三者差别并不明显，本人还是推荐用stdlib内置的qsort——简单，安全。

Sunday, April 29, 2012

输入输出效率分析

Labels: OI, USACO

请先看这篇博文，注意字符串的读入方式：http://jim-think.blogspot.com/2011/10/contact.html
在USACO平台上，上面博文中的代码运行最长运行时间～0.4s

在同学的启发下，本人修改了读入部分，换成了如下代码：

C语言: 高亮代码由发芽网提供

char c;

while(!feof(stdin))

{

    c = getchar();

    if(c == '0')    str[len ++] = 0;

    else if(c == '1')    str[len ++] = 1;

}

重新提交，结果如下：

   Test 1: TEST OK [0.000 secs, 11992 KB]
   Test 2: TEST OK [0.000 secs, 11992 KB]
   Test 3: TEST OK [0.000 secs, 11992 KB]
   Test 4: TEST OK [0.000 secs, 11992 KB]
   Test 5: TEST OK [0.022 secs, 11992 KB]
   Test 6: TEST OK [0.022 secs, 11992 KB]
   Test 7: TEST OK [0.022 secs, 11992 KB]

程序运行时间大大缩短！
可见，strcat的效率十分低下。
In conclusion，选择合适的输入输出方式避免时间浪费。

USACO Snail Trail

Labels: OI, USACO

一开始想复杂了，甚至拿来建图。其实直接用DFS模拟蜗牛的路径就可以了。貌似DFS效率并不是很低，最长耗时不过0.02s。

C语言: 高亮代码由发芽网提供

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int N;
int map[125][125];
int dx[4] = {0,0,-1,1};
int dy[4] = {1,-1,0,0};
int max;

void init()
{
    int B,i;
    char c;
    scanf("%d%d\n",&N,&B);
    while(B --)
    {
        scanf("%c%d\n",&c,&i);
        map[i][(int)(c - 'A' + 1)] = 1;
    }
    for(i = 0;i <= N + 1;i ++)  //borders as blocks
        map[0][i] = map[N + 1][i] = map[i][0] = map[i][N + 1] = 1;
}

int visit[125][125] = {};

void dfs(int i,int j,int step,int d)
{
    if(step > max)    max = step;
    if(map[i + dx[d]][j + dy[d]] == 1)  //block ahead, change direction
    {
        if(d <= 1)
        {
            int k;
            for(k = 2;k <= 3;k ++)
            if(map[i + dx[k]][j + dy[k]] == 0 && visit[i + dx[k]][j + dy[k]] == 0)
            {
                visit[i + dx[k]][j + dy[k]] = 1;
                dfs(i + dx[k],j + dy[k],step + 1,k);
                visit[i + dx[k]][j + dy[k]] = 0;
            }
        }
        if(d >= 2)
        {
            int k;
            for(k = 0;k <= 1;k ++)
            if(map[i + dx[k]][j + dy[k]] == 0 && visit[i + dx[k]][j + dy[k]] == 0)
            {
                visit[i + dx[k]][j + dy[k]] = 1;
                dfs(i + dx[k],j + dy[k],step + 1,k);
                visit[i + dx[k]][j + dy[k]] = 0;
            }
        }
    }
    else
    {
        if(visit[i + dx[d]][j + dy[d]] == 0)   //go ahead
        {
            visit[i + dx[d]][j + dy[d]] = 1;
            dfs(i + dx[d],j + dy[d],step + 1,d);
            visit[i + dx[d]][j + dy[d]] = 0;
        }
    }
}

int main()
{
    freopen("snail.in","r",stdin);
    freopen("snail.out","w",stdout);
    init();
    memset(visit,0,sizeof(visit));
    dfs(1,1,1,0);
    memset(visit,0,sizeof(visit));
    dfs(1,1,1,3);
    printf("%d\n",max);
    return 0;
}

Friday, April 27, 2012

USACO Music Theme

Labels: Binary Search, dynamic programming, OI, USACO

最近几天生病在家，因此做题速度略有上升。

这道题有两种思路：
1、枚举最长theme长度，然后寻找是否存在。可以用二分提升速度
2、动态规划
先说第一种吧。先处理出一个diff数组，diff[i] = note[i + 1] - note[i]，那么如果存在长度为n的，中间至少间隔1个元素的diff子串，那么就有长度为n+1的theme。所以就有了下面的代码。

C语言: 高亮代码由发芽网提供

/*

LANG:C

ID:niat8181

PROB:theme

*/



#include <stdio.h>

#include <stdlib.h>

#include <string.h>



int note[5050];

int diff[5050];

long diff_sum[5050];   //for qiuckness in comparison

int n;



int find(int len)

{

    int i,j;

    int t;

    for(i = 0;i <= n - 2 * len;i ++)

    {

        t = diff_sum[i + len] - diff_sum[i];

        for(j = i + len;j < n - len;j ++)

            if(diff_sum[j + len] - diff_sum[j] == t && memcmp(diff + i,diff + j,len * sizeof(int)) == 0)        return 1;

    }

    return 0;

}



int main()

{

    freopen("theme.in","r",stdin);

    freopen("theme.out","w",stdout);

    scanf("%d\n",&n);

    int i;

    for(i = 0;i < n;i ++)

        scanf("%d",&note[i]);

    for(i = 0;i < n - 1;i ++)

        diff[i] = note[i + 1] - note[i];

    diff_sum[0] = 0;

    for(i = 0;i < n - 1;i ++)

        diff_sum[i + 1] = diff_sum[i] + diff[i];

    

    int l,r,mid;

    r = n / 2 - 1;

    l = 3;

    while(l < r)  //二分

    {

        mid = (l + r + 1) / 2;

        if(find(mid))

            l = mid;

        else

            r = mid - 1;

    }

    if(l >= 4)    printf("%d\n",l + 1);   //there is a theme

    else printf("0\n");   //no theme exists

    return 0;

}

现在说动态规划的。话说俺好久没写动态规划题目了，思路没有以前那么敏捷。这个题目可以说是最长公共子串（我觉得有必要翻一下算法导论额）的改版把。
用len[i][j]表示分别以note[i],note[j]开头的乐曲的最长相似长度。那么:
len[i][j] = len[i + 1][j + 1] + 1
当note[i] - note[j] == note[i + 1] - note[j + 1]（即可以连接成一个更长的theme）；
否则len[i][j] = 1(自身长度)

读者是否注意到，这个动态规划形式是二维的，5000*5000的int数组需要约50M空间。那么，就此放弃动态规划吗？

在状态转移方程中可以发现，len[i][j]仅和len[i+1][j+1]有关系。这样，一维数组就可以了。USACO的解答里甚至只用一个变量就足矣了。具体实施请看代码：

C语言: 高亮代码由发芽网提供

#include <stdio.h>

#include <stdlib.h>

#include <string.h>



int note[5050];



int main()

{

    freopen("theme.in","r",stdin);

    freopen("theme.out","w",stdout);

    int N,i,d;

    int len;

    int maxlen = 0;

    scanf("%d\n",&N);

    for(i = 0;i < N;i ++)

        scanf("%d",&note[i]);

    for(d = 1;d < N;d ++)

    {

        len = 1;

        for(i = N - d - 2;i >= 0;i --)

        {

            if(note[i] - note[i + d] == note[i + 1] - note[i + d + 1])

                len ++;

            else

                len = 1;

            if(len > d)    len = d;   //themes do not overlap, careful here

            if(maxlen < len)    maxlen = len;   //compare while computing

        }

    }

    if(maxlen >= 5)

        printf("%d\n",maxlen);

    else

        printf("0\n");   //no theme found

    return 0;

}