数据规模对数组的读取效率的影响——顺序读取和随机读取

来源：互联网发布：java程序调试步骤编辑：程序博客网时间：2024/05/22 02:07

数组是可以随机读取的数据结构，在数据量比较小的情况下，数组的顺序读取和随机读取几乎都能在瞬间完成，我们是感觉不到的，对我们的程序也不会感觉到有什么影响，但是在数据规模比较大的情况下，可能就会明显的影响到算法的性能。

下面测试不同数据规模下，数组的顺序读取和随机读取所耗费的时间。其中输入文件是随机产生的整数，每个整数一行。文件为txt格式。程序的工作原理很简单，请看main函数中的源代码，这样可以做到在其他条件都一致的条件下，观察顺序读取和随机读去对象能的影响。

#include <iostream>#include <fstream>#include <string>#include <stdlib.h>#include <sys/time.h>#define MAX 10000000using namespace std;void readNum(int a[]){string filename;ifstream infile("data_1000w.txt", ios::in);string textline = "";int i = 0;while(getline(infile, textline, '\n')){a[i] = atoi(string(textline).c_str());i++;}infile.close();}long getCurrentTime(){struct timeval tv;gettimeofday(&tv, NULL);return tv.tv_sec * 1000 + tv.tv_usec / 1000;}int main(){int a[MAX] = {0};int b[MAX] = {0};int c[MAX] = {0};int d[MAX] = {0};readNum(a);readNum(b);cout << "Number Counts:" << MAX << endl;cout << "Sort Result:" << endl;long time_1 = getCurrentTime();int max = 0;for(int i = 0; i < MAX-1; i++){max = a[i];c[i] = a[i+1];}long time_2 = getCurrentTime();cout << time_2 - time_1 << " ms" << endl;long time_3 = getCurrentTime();int min = 0;for(int j = 0; j < MAX-1; j++){min = c[j];d[j] = c[min];}long time_4 = getCurrentTime();cout << time_4 - time_3 << " ms" << endl;return 1;}

分别用100万数据和1000万数据做测试，结果如下图所示：

100万数据：顺序读取耗时5ms，随机读取耗时36ms。

1000万数据：顺序读取耗时52ms，随机读去耗时239ms。

看了以上的结果，奋斗在IT一线的同志们，以后写程序可要注意了，数组虽然是一种随机存取的数据结构，但也要看数据的规模哦。如果亲们写算法的时候需要处理大量的数据，那么尽量优化算法，使用顺序的方式读取数组吧。

1 0