php foreach 使用引用注意事项

前言

看过PHP相关书籍的都会了解到PHP有个这样的特性:写时复制。所以在用foreach时,需要对数据做修改的时候,都会复制数据,如果数据很大,那么就会带来一定的内存消耗,所以为了避免这种复制操作,就用到了引用,下面就介绍下引用的坑

问题案例

<?php
    $arr = array(4, 5, 6);
    var_dump($arr);

    foreach ($arr as &$v) {
        //do something here
    }

    foreach ($arr as $v) {
        //do something here
    }
    var_dump($arr);
?>

输出为:

array(3) {
  [0]=>
  int(4)
  [1]=>
  int(5)
  [2]=>
  int(6)
}
array(3) {
  [0]=>
  int(4)
  [1]=>
  int(5)
  [2]=>
  &int(5)
}

问题分析

foreach 中不使用引用就没事, 用 foreach $k => $v 然后 $ar[$k] 来改变原始数组, 略微损失点效率。

执行第一个使用引用的 foreach 时:

一开始, $v 指向 $arr[0] 的存储空间,空间内存储着 4 , foreach 结束时, $v 指向 $arr[2] 的存储空间,空间内存储着 6 。

开始执行第二个 foreach 时:

注意和第一个 foreach 不同, 第二个 foreach 没有使用引用,那么就是赋值方式, 即将 $arr 的值依次 赋值 给 $v 。 进行到第一个元素时,要将 $ar[0] 赋值给 $v 。 问题就在这里,由于刚刚执行完第一个 foreach, $v 不是一个新变量,而是已经存在的、指向 $arr[2] 的那个 引用 , 如此一来,对 $v 进行赋值的时候,就将 $arr[0] = 4 写入了 $arr[2] 的实际存储空间, 相当于对 $arr[2] 进行赋值。 依此类推,第二个 foreach 执行的结果, 就是数组的最后一个元素变成了倒数第二个元素的值。

PHP 的开发者也认为,这种情况属于语言特性造成的,不是 bug。要修复这个问题,一种方法是对 foreach 进行特殊处理, 另一种就是限制 foreach 中 $v 的作用域, 这两种方式都与目前 PHP 的语言特性不符,开发人员不愿改, 但还是在 官方文档 中用 Warning 进行了说明。

解决方案

简单的方法,就是在使用了引用的 foreach 之后, unset 掉 $v

修改后的案例:

<?php
    $arr = array(4, 5, 6);
    var_dump($arr);

    foreach ($arr as &$v) {
    //do something here
    }
    unset($v);

    foreach ($arr as $v) {
    //do something here
    }
    var_dump($arr);
?>

输出:

array(3) {
    [0]=>
    int(4)
    [1]=>
    int(5)
    [2]=>
    int(6)
}
array(3) {
    [0]=>
    int(4)
    [1]=>
    int(5)
    [2]=>
    int(6)
}