百万级二维数组遍历：行优先循环还是列优先循环更快？-图灵课堂

百万级二维数组遍历：行优先循环还是列优先循环更快？

百万级二维数组高效遍历：循环顺序优化

在处理超大二维数组时，循环遍历的顺序直接影响程序效率。本文分析了一个100万元素的二维数组matrix(假设size是1000元)[x][y]两种循环方式的性能差异，并解释其原因。

问题：我们有两次经历matrixx[x][y]的方法：

方法一(行优先)：

for (int x = 0; x < size; x++) {
  for (int y = 0; y < size; y++) {
    // ...操作...
  }
}

方法二(列优先)：

for (int y = 0; y < size; y++) {
  for (int x = 0; x < size; x++) {
    // ...操作...
  }
}

哪种方法更快？为什么？

回答与分析：

虽然直觉上两种方法差别不大，但实际测试表明性能差距明显。这不是由编译器优化引起的，而是由内存访问机制决定的。

二维数组通常以行优先的方式存储在内存中。matrix[x][y]内存地址与x和y的值密切相关。方法一(行优先遍历)导致内存访问跳跃。访问matrix[x][y]当程序首先访问matrix时[x][0]再次访问matrix[x][1]，依次类推。当内部循环结束时，下一个访问元素matrix[x+1][0]和matrix[x][size-1]内存相距较远，导致未命中缓存，降低效率。

相反，方法二(列优先遍历)的内存访问更加连续。程序依次访问matrix[0][y], matrix[1][y], matrix[2][y]..，这些元素连续存储在内存中，充分利用CPU缓存来提高效率。这类似于线性扫描一维数组。

因此，对于行优先存储的二维数组，列优先遍历（方法2）通常比行优先遍历（方法1）更快，因为它更好地利用了CPU缓存机制，减少了未命中缓存的次数。

以上是百万级二维数组遍历:优先循环还是优先循环更快？详情请关注图灵教育的其他相关文章！

百万级二维数组遍历：行优先循环还是列优先循环更快？

精品课程

技术教程

图灵资讯

图灵内推

图灵公众号