缺点1:foreach循环后留下悬挂指针
在foreach循环中,如果我们须要变动迭代的元素或是为了提高效率,利用引用是一个好办法:
$arr=array(1,2,3,4);

foreach($arras&$value){
$value=$value2;
}
// $arr is now array(2, 4, 6, 8)
这里有个问题很多人会含糊。循环结束后,$value并未销毁,$value实在是数组中末了一个元素的引用,这样在后续对$value的利用中,如果不知道这一点,会引发一些莫名奇妙的缺点:)看看下面这段代码:
$array=[1,2,3];
echoimplode(',',$array),\"大众\n\"大众;
foreach($arrayas&$value){}// by reference
echoimplode(',',$array),\"大众\n\"大众;
foreach($arrayas$value){}// by value (i.e., copy)
echoimplode(',',$array),\"大众\n\公众;
上面代码的运行结果如下:
1,2,3
1,2,3
1,2,2
你猜对了吗?为什么是这个结果呢?
我们来剖析下。第一个循环过后,$value是数组中末了一个元素的引用。第二个循环开始:
第一步:复制$arr[0]到$value(把稳此时$value是$arr[2]的引用),这时数组变成[1,2,1]
第二步:复制$arr[1]到$value,这时数组变成[1,2,2]
第三步:复制$arr[2]到$value,这时数组变成[1,2,2]
综上,终极结果便是1,2,2
避免这种缺点最好的办法便是在循环后立即用unset函数销毁变量:
$arr=array(1,2,3,4);
foreach($arras&$value){
$value=$value2;
}
unset($value);// $value no longer references $arr[3]
缺点2:对isset()函数行为的缺点理解
对付isset()函数,变量不存在时会返回false,变量值为null时也会返回false。这种行为很随意马虎把人弄含糊。。。看下面的代码:
$data=fetchRecordFromStorage($storage,$identifier);
if(!isset($data['keyShouldBeSet']){
// do something here if 'keyShouldBeSet' is not set
}
写这段代码的人本意可能是如果$data[‘keyShouldBeSet’]未设置,则实行对应逻辑。但问题在于纵然$data[‘keyShouldBeSet’]已设置,但设置的值为null,还是会实行对应的逻辑,这就不符合代码的本意了。
下面是其余一个例子:
if($_POST['active']){
$postData=extractSomething($_POST);
}
// ...
if(!isset($postData)){
echo'post not active';
}
上 面的代码假设$_POST[‘active’]为真,那么$postData该当被设置,因此isset($postData)会返回true。反之,上 面代码假设isset($postData)返回false的唯一路子便是$_POST[‘active’]也返回false。
真是这样吗?当然不是!
纵然$_POST[‘active’]返回true,$postData也有可能被设置为null,这时isset($postData)就会返回false。这就不符合代码的本意了。
如果上面代码的本意仅是检测$_POST[‘active’]是否为真,下面这样实现会更好:
if($_POST['active']){
$postData=extractSomething($_POST);
}
// ...
if($_POST['active']){
echo'post not active';
}
判断一个变量是否真正被设置(区分未设置和设置值为null),array_key_exists()函数或许更好。重构上面的第一个例子,如下:
$data=fetchRecordFromStorage($storage,$identifier);
if(!array_key_exists('keyShouldBeSet',$data)){
// do this if 'keyShouldBeSet' isn't set
}
其余,结合get_defined_vars()函数,我们可以更加可靠的检测变量在当前浸染域内是否被设置:
if(array_key_exists('varShouldBeSet',get_defined_vars())){
// variable $varShouldBeSet exists in current scope
}
缺点3:稠浊返回值和返回引用
考虑下面的代码:
classConfig
{
private$values=[];
publicfunction getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
运行上面的代码,将会输出下面的内容:
PHPNotice:Undefinedindex:testin/path/to/my/script.php on line21
问题出在哪呢?问题就在于上面的代码稠浊了返回值和返回引用。在PHP中,除非你显示的指定返回引用,否则对付数组PHP是值返回,也便是数组的拷贝。因此上面代码对返回数组赋值,实际是对拷贝数组进行赋值,非原数组赋值。
// getValues() returns a COPY of the $values array, so this adds a 'test' element
// to a COPY of the $values array, but not to the $values array itself.
$config->getValues()['test']='test';
// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't
// contain a 'test' element (which is why we get the \"大众undefined index\"大众 message).
echo$config->getValues()['test'];
下面是一种可能的办理办法,输出拷贝的数组,而不是原数组:
$vals=$config->getValues();
$vals['test']='test';
echo$vals['test'];
如果你便是想要改变原数组,也便是要反回数组引用,那该当如何处理呢?办法便是显示指定返回引用即可:
classConfig
{
private$values=[];
// return a REFERENCE to the actual $values array
publicfunction&getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
经由改造后,上面代码将会像你期望那样会输出test。
我们再来看一个例子会让你更含糊的例子:
classConfig
{
private$values;
// using ArrayObject rather than array
publicfunction __construct(){
$this->values=newArrayObject();
}
publicfunction getValues(){
return$this->values;
}
}
$config=newConfig();
$config->getValues()['test']='test';
echo$config->getValues()['test'];
如果你想的是会和上面一样输出“ Undefined index”缺点,那你就错了。代码会正常输出“test”。缘故原由在于PHP对付工具默认便是按引用返回的,而不是按值返回。
综上所述,我们在利用函数返回值时,要弄清楚是值返回还是引用返回。PHP中对付工具,默认是引用返回,数组和内置基本类型默认均按值返回。这个要与其它措辞差异开来(很多措辞对付数组是引用通报)。
像其它措辞,比如Java或C#,利用getter或setter来访问或设置类属性是一种更好的方案,当然PHP默认不支持,须要自己实现:
classConfig
{
private$values=[];
publicfunction setValue($key,$value){
$this->values[$key]=$value;
}
publicfunction getValue($key){
return$this->values[$key];
}
}
$config=newConfig();
$config->setValue('testKey','testValue');
echo$config->getValue('testKey');// echos 'testValue'
上面的代码给调用者可以访问或设置数组中的任意值而不用给与数组public访问权限。觉得怎么样:)
缺点4:在循环中实行sql查询
在PHP编程中创造类似下面的代码并不少见:
$models=[];
foreach($inputValuesas$inputValue){
$models[]=$valueRepository->findByValue($inputValue);
}
当然上面的代码是没有什么缺点的。问题在于我们在迭代过程中$valueRepository->findByValue()可能每次都实行了sql查询:
$result=$connection->query(\"大众SELECT `x`,`y` FROM `values` WHERE `value`=\公众.$inputValue);
如果迭代了10000次,那么你就分别实行了10000次sql查询。如果这样的脚本在多线程程序中被调用,那很可能你的系统就挂了。。。
在编写代码过程中,你该当要清楚什么时候该当实行sql查询,尽可能一次sql查询取出所有数据。
有一种业务场景,你很可能会犯上述缺点。假设一个表单提交了一系列值(假设为IDs),然后为了取出所有ID对应的数据,代码将遍历IDs,分别对每个ID实行sql查询,代码如下所示:
$data=[];
foreach($idsas$id){
$result=$connection->query(\"大众SELECT `x`, `y` FROM `values` WHERE `id` = \"大众.$id);
$data[]=$result->fetch_row();
}
但同样的目的可以在一个sql中更加高效的完成,代码如下:
$data=[];
if(count($ids)){
$result=$connection->query(\"大众SELECT `x`, `y` FROM `values` WHERE `id` IN (\"大众.implode(',',$ids));
while($row=$result->fetch_row()){
$data[]=$row;
}
}
缺点5:内存利用低效和错觉
一次sql查询获取多条记录比每次查询获取一条记录效率肯定要高,但如果你利用的是php中的MySQL扩展,那么一次获取多条记录就很可能会导致内存溢出。
我们可以写代码来实验下(测试环境: 512MB RAM、MySQL、php-cli):
// connect to mysql
$connection=newmysqli('localhost','username','password','database');
// create table of 400 columns
$query='CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT';
for($col=0;$col<400;$col++){
$query.=\"大众, `col$col` CHAR(10) NOT NULL\公众;
}
$query.=');';
$connection->query($query);
// write 2 million rows
for($row=0;$row<2000000;$row++){
$query=\"大众INSERT INTO `test` VALUES ($row\"大众;
for($col=0;$col<400;$col++){
$query.=', '.mt_rand(1000000000,9999999999);
}
$query.=')';
$connection->query($query);
}
现在来看看资源花费:
// connect to mysql
$connection=newmysqli('localhost','username','password','database');
echo\公众Before: \公众.memory_get_peak_usage().\"大众\n\"大众;
$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 1');
echo\"大众Limit 1: \公众.memory_get_peak_usage().\"大众\n\"大众;
$res=$connection->query('SELECT `x`,`y` FROM `test` LIMIT 10000');
echo\"大众Limit 10000: \公众.memory_get_peak_usage().\"大众\n\"大众;
输出结果如下:
Before:224704
Limit1:224704
Limit10000:224704
根据内存利用量来看,貌似统统正常。为了更加确定,试着一次获取100000条记录,结果程序得到如下输出:
PHPWarning:mysqli::query():(HY000/2013):
Lostconnection toMySQLserver during queryin/root/test.php on line11
这是怎么回事呢?
问 题出在php的mysql模块的事情办法,mysql模块实际上便是libmysqlclient的一个代理。在查询获取多条记录的同时,这些记录会直接 保存在内存中。由于这块内存不属于php的内存模块所管理,以是我们调用memory_get_peak_usage()函数所得到的值并非真实利用内存 值,于是便涌现了上面的问题。
我们可以利用mysqlnd来代替mysql,mysqlnd编译为php自身扩展,其内存利用由php内存管理模块所掌握。如果我们用mysqlnd来实现上面的代码,则会更加真实的反应内存利用情形:
Before:232048
Limit1:324952
Limit10000:32572912
更加糟糕的是,根据php的官方文档,mysql扩展存储查询数据利用的内存是mysqlnd的两倍,因此原来的代码利用的内存是上面显示的两倍旁边。
为了避免此类问题,可以考虑分几次完成查询,减小单次查询数据量:
$totalNumberToFetch=10000;
$portionSize=100;
for($i=0;$i<=ceil($totalNumberToFetch/$portionSize);$i++){
$limitFrom=$portionSize$i;
$res=$connection->query(
\"大众SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize\公众);
}
联系上面提到的缺点4可以看出,在实际的编码过程中,要做到一种平衡,才能既知足功能哀求,又能担保性能。
本文转载,点击下方链接可以查看原文