对PHP排序稳定性问题的深思!

对快速排序有一定了解的话可以知道,快速排序是不稳定的所以这段代码在元素default优先级都相同的情况下输出将不会是之前的顺序,但在 php7 环境下测试结果为什么会保留原来的顺序呢。

PHP排序稳定性问题

最近在工作中碰到一个挺有意思的问题,线上输入是一串排好序的关联数组,经过一系列处理后输出的数组却是乱序,且本地运行无法复现。查看相关代码后,最让人在意的是这一段:

$categories = Arr::sort($categories, function ($node) {
return $node[;default;];
}, true);

作用是按default优先级将元素提到前面,首先确认了下线上的illuminate/support版本和本地一致,查看Arr::sort()源码:


$descending ? arsort($results, $options)
: asort($results, $options);

最终还是调用 php 的asort,线上是 php5 而本地和测试因为最近考虑升级都换成了 php7,最后在 php5 环境下成功复现,确定出是sort问题。

在排序前后相等的元素相对位置不变即说这个算法是稳定的。

对快速排序有一定了解的话可以知道,快速排序是不稳定的所以这段代码在元素default优先级都相同的情况下输出将不会是之前的顺序,但在 php7 环境下测试结果为什么会保留原来的顺序呢。难道关于我之前理解的天底下所有默认排序都是快速排序这一点是错的吗?

好吧,让我们来快速看看 php 源码是如何解决这个问题的。到 github 官方的 php-src 直接搜索asort in this repository,找c文件,找到这个函数定义在 arr.c:814

PHP_FUNCTION(asort)
{
zval *array;
zend_long sort_type = PHP_SORT_REGULAR;
bucket_compare_func_t cmp;

ZEND_PARSE_PARAMETERS_START(1, 2)
Z_PARAM_ARRAY_EX(array, 0, 1)
Z_PARAM_OPTIONAL
Z_PARAM_LONG(sort_type)
ZEND_PARSE_PARAMETERS_END();

// 设置比较函数
cmp = php_get_data_compare_func(sort_type, 0);

zend_hash_sort(Z_ARRVAL_P(array), cmp, 0);

RETURN_TRUE;
}

可以看到最终调用的是zend_hash_sort(),我们继续搜索:

对PHP排序稳定性问题的深思!

php零基础到就业直播视频课:进入学习API 文档、设计、调试、自动化测试一体化协作工具:点击使用

发现这个函数是zend_hash_sort_ex()的套娃,最后找到zend_hash.c:2497

ZEND_API void ZEND_FASTCALL zend_hash_sort_ex(HashTable *ht, sort_func_t sort, bucket_compare_func_t compar, zend_bool renumber)
{
Bucket *p;
uint32_t i, j;

IS_CONSISTENT(ht);
HT_ASSERT_RC1(ht);

if (!(ht->nNumOfElements>1) && !(renumber && ht->nNumOfElements>0)) {
/* Doesn;t require sorting */
return;
}

// 这里的hole指数组元素被unset掉产生的洞
if (HT_IS_WITHOUT_HOLES(ht)) {
/* Store original order of elements in extra space to allow stable sorting. */
for (i = 0; i < ht->nNumUsed; i++) {
Z_EXTRA(ht->arData[i].val) = i;
}
} else {
/* Remove holes and store original order. */
for (j = 0, i = 0; j < ht->nNumUsed; j++) {
p = ht->arData + j;
if (UNEXPECTED(Z_TYPE(p->val) == IS_UNDEF)) continue;
if (i != j) {
ht->arData[i] = *p;
}
Z_EXTRA(ht->arData[i].val) = i;
i++;
}
ht->nNumUsed = i;
}

sort((void *)ht->arData, ht->nNumUsed, sizeof(Bucket), (compare_func_t) compar,
(swap_func_t)(renumber? zend_hash_bucket_renum_swap :
((HT_FLAGS(ht) & HASH_FLAG_PACKED) ? zend_hash_bucket_packed_swap : zend_hash_bucket_swap)));

好耶!,官方注释里就有说明是怎么实现排序的稳定性,在排序之前用这个Z_EXTRA保留了原数组元素到下标的映射。

但当我搜索这块代码提交信息时发现了一个问题:稳定排序相关的 rfc 在https://wiki.php.net/rfc/stable_sorting,可以看到是发生在今年五月份且针对 php8.0 的。

?? 那之前的 php7 排序稳定是怎么回事。

马上构造个例子:

$count = 10;
$cc = [];
for ($i=0; $i<$count; $i++) {
$cc[] = [
;id; => $i,
;default; => rand(0, 10),
];
}
$cc = Arr::sort($cc, function ($i) {
return $i[;default;];
});
dd($cc);

经过多次在 php7 下的测试发现:当$count比较小的时候,排序才是稳定的,但$count较大情况下的排序又变成不稳定。也就是线上排序不稳定而本地无法复现其实是用例的数组长度太短所致。

看到这里可以确定是快速排序长度阈值优化的问题,最后查了下相关资料。php7 中的sort是基于LLVM中libc++的std::sort实现。当元素数量小于等于16时候有特殊优化,大于16才走快速排序,而 php5 是直接就走快速排序的。

<?php

$count = 100;
$cc = [];
for ($i=0; $i<$count; $i++) {
$cc[] = [
;id; => $i,
;default; => rand(0, 10),
];
}
usort($cc, function($a, $b){
if ($a[;default;] == $b[;default;]) return 0;
return ($a[;default;] < $b[;default;]) ? 1 : -1;
});
print_r($cc);

最后在 php8 环境下试了试,排序绝对稳定

PHP数组学习之使用冒泡算法对元素进行升序排序!

原创2021-08-17 10:05:221828 + php学习QQ群(点击入群)在之前的文章《PHP数组学习之返回给定两数间的全部公因数和最大公因数》中,我们介绍了利用数组方法返回给定两个整数a和b间的全部公因数和最大公因数的方法。这次我们进行PHP数组的学习,介绍一下利用PHP如何实现冒泡排序,使用冒泡算法怎么对数组元素进行升序排序。

首先我们来了解一下什么是冒泡算法(冒泡排序)?

冒泡排序(Bubble Sort),是因为越小的元素会经由交换慢慢“浮”到数列的顶端(升序或降序排列),就如同碳酸饮料中二氧化碳的气泡最终会上浮到顶端一样,故名“冒泡排序”。

思想:

  • 比较相邻的两个元素,如果满足条件(第一个比第二个大,或者第一个比第二个小),就交换,否则不动。

  • 再比较接下来的两个相邻的元素,然后满足条件就交换,否则依然不动。

  • 就这样对每一对相邻元素做同样的工作,从开始第一对到结尾的最后一对。直到最后的元素应该会是最大(最小)的数。

  • 依次循环操作下去,最终一个元素,会固定在最下边。

我们使用冒泡算法对数组元素进行升序排序:

有这样一个数组:

$arr = array('23','4','0','3','2','24','20');

数组有7个元素,因为是实现升序排序,即从小到大排序,因此执行步骤:

第一轮循环:

  • 第一个元素23和第二个元素4比,因为23大于4,因此执行交换操作

  • 第二个元素(此时为23)和第三个元素0比较,因为23大于0,因此执行交换操作—23就变为第三元素

  • 第三个元素(此时为23)和第四个元素3比,还是大于,执行交换操作—23就变为第四元素

  • 第四个元素(此时为23)和第五个元素2比,还是大于,执行交换操作—23就变为第五元素

  • 第五个元素(此时为23)和第六个元素24比,因为23小于24,因此不执行交换操作–第六个元素还是24

  • 第六个元素(此时为24)和第七个元素20比,因为24大于200,执行交换操作—24就变为第七元素

经过一轮的循环对比,最大的数字就下沉到最下边了。小的数字逐渐向上浮出。

此时数组元素为:4、0、3、2、23、20、24

第二轮循环:

  • 第一个元素4和第二个元素0比,因为4大于0,因此执行交换操作—4就变为第二元素

  • 第二个元素(此时为4)和第三个元素3比较,因为4大于3,因此执行交换操作—4就变为第三元素

  • 第三个元素(此时为4)和第四个元素2比,还是大于,执行交换操作—4就变为第四元素

  • 第四个元素(此时为4)和第五个元素23比,因为4小于23,因此不执行交换操作—第五元素还是23

  • 第五个元素(此时为23)和第六个元素20比,因为23大于20,执行交换操作–23就变为第六元素

  • 第六个元素(此时为23)和第七个元素24比,小于,因此不执行交换操作–第七个元素还是24

此时数组元素为:0、3、2、4、20、23、24

…..

以此类推,最后数组元素为:0、2、3、4、20、23、24

我们看看实现方法:

<?php
//定义一个数组
$arr = array('23','4','0','3','2','24','20');

function BubbleSort(array $arr)
{

for ($i=0 ; $i <count($arr) ; $i++) {
//设置一个空变量,交换值
$data = '';
for ($j=$i ; $j < count($arr)-1 ; $j++) {
if ($arr[$i] > $arr[$j+1]) {

$data= $arr[$i];
$arr[$i] = $arr[$j+1];
$arr[$j+1] = $data;
}
}
}

return $arr;
}
echo "<pre>";
print_r(BubbleSort($arr));

输出结果:

对PHP排序稳定性问题的深思!

php零基础到就业直播视频课:进入学习API 文档、设计、调试、自动化测试一体化协作工具:点击使用

好了就说到这里了,有其他想知道的,可以点击这个哦。→ →php视频教程

最后给大家推荐一个PHP数组的免费视频教程:PHP函数之array数组函数视频讲解,快来学习吧!

以上就是PHP数组学习之使用冒泡算法对元素进行升序排序!的详细内容,更多请关注钦钦技术栈其它相关文章!

转载至:php中文网【www.php.cn】

版权声明:本文(即:原文链接:https://www.qin1qin.com/catagory/25165/)内容由互联网用户自发投稿贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 630367839@qq.com 举报,一经查实,本站将立刻删除。

(0)
上一篇 2022年9月23日 下午1:02
下一篇 2022年9月23日 下午1:03
软件定制开发公司

相关阅读

发表回复

登录后才能评论
通知:禁止投稿所有关于虚拟货币,币圈类相关文章,发现立即永久封锁账户ID!