while ($row = mysql_fetch_assoc($result)) { // ...}

当然, 这种问题有许多优化的方法. 不过, 就这个问题来讲, 我首先想到, MySQL是经典的C/S(Client/Server, 客户端/做事器)模型, 在遍历结果集之前, 底层的实现可能已经把所有的数据通过网络(假设利用TCP/IP)读到了Client的缓冲区, 也有另一种可能, 便是数据还在Server真个发送缓冲区里, 并没有传给Client.

在查看PHP和MySQL的源码之前, 我把稳到PHP手册里有两个功能附近的函数:

mysql_query()mysql_unbuffered_query()

两个函数的字面意思息争释证明了我的想法, 前一个函数实行时, 会把所有的结果集从Server端读到Client真个缓冲区中, 而后一个则没有, 这便是”unbuffered(未缓冲)”的意思.

php结果集PHP查询MySQL年夜量数据的内存占用剖析 PHP

那便是说, 如果用mysql_unbuffered_query()实行了一条返回大量结果集的SQL语句, 在遍历结果之前, PHP的内存是没有被结果集占用的. 而用mysql_query()来实行同样的语句的话, 函数返回时, PHP的内存占用便会急剧增加, 立即耗光内存.

如果阅读PHP的干系代码, 可以看到这两个函数的实现上的异同:

/ {{{ proto resource mysql_query(string query [, int link_identifier]) Sends an SQL query to MySQL /PHP_FUNCTION(mysql_query){ php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_STORE_RESULT);}/ }}} // {{{ proto resource mysql_unbuffered_query(string query [, int link_identifier]) Sends an SQL query to MySQL, without fetching and buffering the result rows /PHP_FUNCTION(mysql_unbuffered_query){ php_mysql_do_query(INTERNAL_FUNCTION_PARAM_PASSTHRU, MYSQL_USE_RESULT);}/ }}} /

两个函数都调用了php_mysql_do_query(), 只差了第2个参数的不同, MYSQL_STORE_RESULT和MYSQL_USE_RESULT. 再看php_mysql_do_query()的实现:

if(use_store == MYSQL_USE_RESULT) { mysql_result=mysql_use_result(&mysql->conn);} else { mysql_result=mysql_store_result(&mysql->conn);}

mysql_use_result()和mysql_store_result()是MySQL的C API函数, 这两个C API函数的差异便是后者把结果集从MySQL Server端全部读取到了Client端, 前者只是读取了却果集的元信息.

回到PHP, 利用mysql_unbuffered_query(), 可以避免内存的立即占用. 如果在遍历的过程不对结果进行”PHP缓存”(如放到某数组中), 则全体实行过程虽然操作了十万条或者百万条或者更多的数据, 但PHP占用的内存始终是非常小的.