作者 | Jeremy Ruten
译者 | 弯月,责编 | 郭芮
出品 | CSDN(ID:CSDNnews)
以下为译文:
PHP的数组非常多变。你可以把它当作映射利用,也可以当作凑集利用,乃至可以当作数据工具利用……如果你很年夜胆,乃至可以把它当作数组利用!
彷佛将PHP数组当作传统的数组(即一个拥有从0开始的整数索引列表)是一件很危险的事情,个中到处都是陷阱,还很随意马虎制造出bug。这统统的缘故原由都是由于PHP的数组并不是真正的数组。
我们来看看这究竟是怎么回事。下面是一个PHP的小问题:下列程序的输出是什么?
<?php$letters = ['d', 'c', 'a', 'b', 'e'];$sorted = $letters;natsort($sorted);print $sorted[0];
答案是:它会输出d!
这段代码的本意是输出按字母排序后的第一个字符串,该当是a。但$sorted[0]的意思并不是“数组中的第一个元素”。它的意思是“查找键0然后返回该键的元素”。
在PHP中,数组实际上是映射(即关联数组),它有键和值。当你利用下面的代码创建数组时,
$ary = ['a', 'b', 'c'];
实际的操作实在是:
$ary = [0 => 'a', 1 => 'b', 2 => 'c'];
PHP会给每个元素指定一个整数键,从0开始依次排列,因此在许多方面这个数组的行为跟传统的数组很相似。
下面,我们考试测验一下键的顺序:
<?php$ary = [1 => 'b', 2 => 'c', 0 => 'a'];print $ary[0]; // 'a'print $ary[1]; // 'b'print $ary[2]; // 'c'// Prints: b c aforeach ($ary as $letter) {print $letter;}// Prints: 1:b 2:c 0:aforeach ($ary as $key => $letter) {print \公众$key:$letter\"大众;}
如果通过键来访问数组,那么其行为跟传统数组很相似。但在迭代数组时,它就不会关心键的顺序,而是按照数组元素定义的顺序:b,c,a。
以是,所有PHP数组都有键和值,但这些键值对还有特定的顺序。换句话说:“PHP数组实际上是有序的映射。”
回到第一个示例:natsort改变了键值对的顺序,但没有改变实际的键:
<?php$letters = ['d', 'c', 'a', 'b', 'e'];$sorted = $letters;natsort($sorted);print_r($letters); // [0 => 'd', 1 => 'c', 2 => 'a', 3 => 'b', 4 => 'e']print_r($sorted); // [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e']print $sorted[0]; // 'd'
如果$sorted[0]不会访问数组中的第一个元素,那么若何才能访问第一个元素呢?或者说,若何才能访问前三个元素呢?方法有以下几种。
array_values
你可以通过array_values给数组“重新编号”。它会返回一个数组,其值与传入的数组相同,但键从零开始重新排列:
<?php$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];$sorted = array_values($sorted);print $sorted[0]; // 'a'print $sorted[1]; // 'b'print $sorted[2]; // 'c'
array_slice
常日,利用索引访问PHP数组时,我们实际上查找的是一个键。但array_slice是一个例外——传入的索引实际上是数组内部的位置,而不是键。
<?php$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];$first_three = array_slice($sorted, 0, 3);print $first_three[0]; // 'a'print $first_three[1]; // 'b'print $first_three[2]; // 'c'
这种做法的一个陷阱便是它依然会保留字符串键,这一点与array_values不同。
reset、next及其他
PHP中的每个数组都有一个内部指针,可以用来迭代数组。reset将内部指针重置到数组的开头。next将指针提高到下一个键值对。还有prev、key、current和end。这些低阶API很丢脸,但能让你理解PHP数组真正的事情事理:
<?php$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];// start at the beginningprint reset($sorted); // 'a'print key($sorted); // 2print current($sorted); // 'a'// advance forwardprint next($sorted); // 'b'print key($sorted); // 3print current($sorted); // 'b'// advance forwardprint next($sorted); // 'c'print key($sorted); // 1print current($sorted); // 'c'// jump to the endprint end($sorted); // 'e'print key($sorted); // 4print current($sorted); // 'e'// there is no next element, so this returnsprint next($sorted);
你险些永久不须要利用这些函数,但有时候可以利用reset来方便地获取数组的第一个值,或者用end获取末了一个值。
Laravel的collect
Laravel有一个非常好用的collections类,该类已被提取到一个独立的函数库中。我们的事情中就在利用这个函数库。
它供应了first和last方法来获取数组的第一个和末了一个元素,以及take方法获取前N个元素。
<?php$sorted = [2 => 'a', 3 => 'b', 1 => 'c', 0 => 'd', 4 => 'e'];print collect($sorted)->first; // 'a'print collect($sorted)->last; // 'e'print_r(collect($sorted)->take(3)->all); // [2 => 'a', 3 => 'b', 1 => 'c']
把稳take会保留数组中的键。许多PHP数组函数都接管一个可选的参数$preserve_keys。而这个collections函数库在封装PHP数组函数时,险些永久都会给这个参数通报true,以是可以认为利用该函数库时,键一贯都被保留。
利用PHP数组的几个建议
下面是我在利用PHP数组时总结的一些心得:
时候小心$ary[0]
每当你看到数组索引为0时,就该当知道这段代码很可能在将PHP数组当作传统数组处理。常日这种假设是不屈安的,特殊是当数组是从其他地方通报过来的情形下。0大概并不是数组中的第一个键,乃至可能根本不存在(例如在实行了array_filter()之后)。
除非是你自己创建的数组,否则该当利用reset($ary)或者库函数,比如collect($ary)->first方法。
考虑对数组重新编号
$ary[0]问题也可以通过另一种办法办理:每当给其他函数通报数组时,确保它的键像传统数组一样。常日这意味着在实行array_filter或者任何可能删除键或改变键的顺序的函数之后须要调用array_values。
你可以说,利用array_values反复“改动”数组违反了数组本身的性子。或许,我们不应该让PHP数组表现得像传统数组,而是该当接管PHP数组的性子,写代码时不要对数组的键做出假设。然而新手很可能会认为PHP数组像传统数组一样。
上面两点遵照了健壮性原则:“发送时要守旧,吸收时要自由。”
比较数组时,键很主要,但顺序不主要
像assertEquals(['a', 'b'], array_filter(['a', , 'b']))之类的比较会失落败,由于[0 => 'a', 1 => 'b']并不即是[0 => 'a', 2=> 'b']!
它们的键必须一样才行。
相反,assertEquals($ary, collect($ary)->sort->all)永久为真,由于对付==来说,键值对的顺序并不主要。例如,[0 => 'a', 1 => 'b'] == [1 => 'b', 0 => 'a']为真。
将数组当作映射利用
假设你有一个$users_by_id数组,个中$users_by_id[32]会查找id为32的User。那么,如果利用array_map(function ($user) { return $user->getName; })来映射该数组,则会得到一个name的数组,其键为user id,由于array_map并不会改变数组的键。在这种情形下保留键非常有用,以是当须要映射时,你该当避免利用可能导致数组重新编号的函数。
将数组当作有序映射利用
可以对$users_by_id数组进行排序,然后利用它:(1)根据id查找用户;(2)按照特定顺序遍历所有用户。利用这个技巧,就不须要像某些其他措辞那样,仅仅为了跟踪顺序而掩护一个单独的id数组。
指示数组的类型
PHP数组造成的许多混乱都是由于它试图将一种数据构造用于两种目的。只管PHP的类型系统不会差异传统数组和映射,但我们该当区分。由于短缺得当的类型系统,我们应该利用变量命名规则来指示类型。例如,传统数组常日用复数形式,如$users,而映射常日以“by x”结尾,如$users_by_id。
总结
思维模型非常主要。我曾经把PHP数组只当作键值对的凑集,但后来我意识到,数组实际上是键值对的有序列表,这时我才真正理解了PHP数组。
关于PHP文档中的数组和数组函数的怪异行为还有许多须要学习的地方,我创造有了精确的思维模型才能理解这些怪异的行为!
原文:https://medium.com/7shifts-engineering-blog/php-arrays-arent-really-arrays-57b627a1e46a
本文为 CSDN 翻译,转载请注明来源出处。
【END】