数据规模对数组的读取效率的影响——顺序读取和随机读取

来源:互联网 发布:java程序调试步骤 编辑:程序博客网 时间:2024/05/22 02:07


        数组是可以随机读取的数据结构,在数据量比较小的情况下,数组的顺序读取和随机读取几乎都能在瞬间完成,我们是感觉不到的,对我们的程序也不会感觉到有什么影响,但是在数据规模比较大的情况下,可能就会明显的影响到算法的性能。

        下面测试不同数据规模下,数组的顺序读取和随机读取所耗费的时间。其中输入文件是随机产生的整数,每个整数一行。文件为txt格式。程序的工作原理很简单,请看main函数中的源代码,这样可以做到在其他条件都一致的条件下,观察顺序读取和随机读去对象能的影响。

#include <iostream>#include <fstream>#include <string>#include <stdlib.h>#include <sys/time.h>#define MAX 10000000using namespace std;void readNum(int a[]){string filename;ifstream infile("data_1000w.txt", ios::in);string textline = "";int i = 0;while(getline(infile, textline, '\n')){a[i] = atoi(string(textline).c_str());i++;}infile.close();}long getCurrentTime(){struct timeval tv;gettimeofday(&tv, NULL);return tv.tv_sec * 1000 + tv.tv_usec / 1000;}int main(){int a[MAX] = {0};int b[MAX] = {0};int c[MAX] = {0};int d[MAX] = {0};readNum(a);readNum(b);cout << "Number Counts:" << MAX << endl;cout << "Sort Result:" << endl;long time_1 = getCurrentTime();int max = 0;for(int i = 0; i < MAX-1; i++){max = a[i];c[i] = a[i+1];}long time_2 = getCurrentTime();cout << time_2 - time_1 << " ms" << endl;long time_3 = getCurrentTime();int min = 0;for(int j = 0; j < MAX-1; j++){min = c[j];d[j] = c[min];}long time_4 = getCurrentTime();cout << time_4 - time_3 << " ms" << endl;return 1;}

分别用100万数据和1000万数据做测试,结果如下图所示:

100万数据:顺序读取耗时5ms,随机读取耗时36ms。

1000万数据:顺序读取耗时52ms,随机读去耗时239ms。



        看了以上的结果,奋斗在IT一线的同志们,以后写程序可要注意了,数组虽然是一种随机存取的数据结构,但也要看数据的规模哦。如果亲们写算法的时候需要处理大量的数据,那么尽量优化算法,使用顺序的方式读取数组吧。
1 0
原创粉丝点击