vlambda博客
学习文章列表

PHP 8的新功能展望:JIT以及其他


万众瞩目的PHP 8,预计将于今年年12月份发布。根据已经批准和实施的RFC预案,可以PHP将带来许多强大的功能和出色的语言改进。作为尝鲜,让我们一起来展望一下PHP8的新功能和改进。


PHP JIT(即时编译器)

很多人可能已经了解,PHP 8中最令人期望功能是JIT功能。在此我们先介绍一下JIT,根据PHP RFC提案:

"PHP JIT为Opcache部分的独立实现。它可以在PHP编译时和运行时启用/禁用。启用后,PHP文件的本机代码将存储在OPcache共享内存的附加区域中,并且op_array→opcodes []。handler指针指向JIT版本代码的入口点。"

为了更好地理解什么是JIT for PHP,我review一下如何从源代码执行到最终结果。

PHP执行过程分为四个阶段:

Lexing/Tokenizing:解释器读取PHP代码并构建一组令牌。

语法解析:解释器检查脚本是否与语法规则匹配,并使用标记来构建抽象语法树(AST),AST是源代码结构的分层表示。

编译:解释器遍历树并将AST节点转换为低级Zend操作码,这些操作码是确定Zend VM执行的指令类型的数字标识符。

解释:操作码将在Zend VM上解释并运行。

基本PHP执行过程的直观表示如下:

PHP 8的新功能展望:JIT以及其他


那么,OPcache如何让PHP执行的更快?JIT执行过程中有哪些变化?

OPcache扩展

由于PHP是一种解释型语言,当运行PHP脚本时,解释器将在每次请求时都会重复地解析,编译和执行代码的过程。这会导致CPU浪费和其他资源耗费,让执行时间增加。

"OPcache通过将预编译的脚本字节码存储在共享内存中来提高PHP性能,从而消除了PHP在每个请求上加载和解析脚本的需要。"

启用OPcache后,PHP解释器仅在脚本首次运行时才进行4个阶段的过程。由于PHP字节码存储在共享内存中,因此可以作为低级中间表示形式缓存(OP)来被重复使用,可以立即在Zend VM上执行。

PHP 8的新功能展望:JIT以及其他


从PHP 5.5开始,Zend OPcache扩展在默认情况下启动,可以通过可以phpinfo()在Zend OPcache来查看Opcache配置情况。


预加载(Reload)

预加载是PHP 7.4新增的OPcache新功能。预加载提供了一种"在运行任何应用程序代码之前"将指定的脚本集存储到OPcache内存中的方法,但是对于典型的基于Web的应用程序而言,它不会带来明显的性能提升。

JIT —及时编译器

即使操作码采用低级中间表示码形式,仍然需要将其编译为机器代码。JIT"不引入任何其他IR(中间表示)形式",使用DynASM(用于代码生成引擎的动态汇编程序)直接从PHP字节码生成本机代码。

简而言之,JIT将中间码的热门部分转换为机器代码。绕过编译,它将能够显著的提高性能和内存使用率。

实时Web应用的JIT

根据JIT RFC,即时编译器实现应提高PHP性能。但是,我们真的会在WordPress等现实应用中体验到这种改进吗?

早期测试表明,JIT可以使CPU密集型工作负载的运行速度大大提高,但是对WordPress等应用并不能带来显著性能提高。

启用JIT后,代码将不会由Zend VM运行,而是由CPU本身运行,这将提高计算速度。诸如WordPress之类的Web应用程序还依赖于TTFB,数据库优化,HTTP请求等其他因素。

因此,当涉及到WordPress和类似的应用程序时,不应该期望PHP的执行速度会大大提高。但是,JIT可以为开发人员带来一些好处。


数字代码的性能明显更好。

"典型" PHP Web应用程序代码的性能略好。

将更多代码从C转移到PHP的潜力,因为PHP现在已经足够快了。"


因此,尽管JIT几乎不会给WordPress性能带来巨大的改善,但它将把PHP升级到一个新的水平,从而使它成为一种可以直接编写许多功能的语言。

不过,JIT的引入将会导致更大的复杂性,它可能导致维护,稳定性和调试成本增加。

PHP 8改进和新功能

除了JIT之外,还值得期望的PHP 8新功能和改进还有很多,它们将使PHP更加可靠和高效。

构造器属性增强

关于如何改进PHP中的对象人体工程学的持续讨论的结果是,构造器属性增强RFC提出了一种新的,更简洁的语法,该语法将简化属性声明,使其更短,更少冗余。

该提议仅与提升的参数有关,即以public,protected和private可见性关键字为前缀的那些方法参数。

目前所有属性必须重复几次(至少四次),然后才能将其与对象一起使用。下面是一个RFC的示例:

class Point {

public int $x;public int $y;public int $z;

public function __construct(int $x = 0,int $y = 0,int $z = 0,) {$this->x = $x;$this->y = $y;$this->z = $z;}}

从PHP 8开始,将有一种更有用的声明参数的方法,上述代码可以简单写为:

class Point {public function __construct(public int $x = 0,public int $y = 0,public int $z = 0,) {}}

对比可以看出,新的属性语法更易读且不易出错。

抽象Trait方法验证

Trait是一种在单一继承语言中代码重用的机制。通常,它们用于声明可在多个类中使用的方法。

特征也可以包含抽象方法。这些方法只是声明方法的签名,但是方法的实现必须使用trait在类中完成。

trait T {abstract public function test(int $x);}class C {use T;public function test(string $x) {}}


如果实现方法与抽象特征方法不兼容,将会抛出致命错误:

Fatal error: Declaration of C::test(string $x) must be compatible with T::test(int $x) in /path/to/your/test.php on line 10

不兼容的方法签名

在PHP中,由于方法签名不兼容而导致的继承错误会引发致命错误或警告,具体取决于导致错误的原因。

如果类正在实现接口,则不兼容的方法签名将引发致命错误。根据对象接口文档:

"实现接口的类必须使用与LSP(Liskov替换原理)兼容的方法签名。不这样做将导致致命错误。下面是一个带接口继承错误的示例:

interface I {public function method(array $a);}class C implements I {public function method(int $a) {}}

在PHP 7.4中,上面的代码将引发以下错误:

Fatal error: Declaration of C::method(int $a) must be compatible with I::method(array $a) in /path/to/your/test.php on line 7

子类中具有不兼容签名的函数将引发警告。

class C1 {public function method(array $a) {}}class C2 extends C1 {public function method(int $a) {}}

在PHP 7.4中,上面的代码只会发出警告:

Warning: Declaration of C2::method(int $a) should be compatible with C1::method(array $a) in /path/to/your/test.php on line 7

在PHP 8,都会抛出致命错误。

Fatal error: Declaration of C2::method(int $a) must be compatible with C1::method(array $a) in /path/to/your/test.php on line 7

数组索引支持负数

在PHP中,如果数组以负索引(start_index < 0)开头,则以下索引自动从0开始。看下面的例子:

$a = array_fill(-5, 4, true);var_dump($a);

在PHP 7.4中,结果如下:

array(4) {[-5]=>bool(true)[0]=>bool(true)[1]=>bool(true)[2]=>bool(true)}

作为对比,在PHP 8中,上面的代码将结果如下:

array(4) {[-5]=>bool(true)[-4]=>bool(true)[-3]=>bool(true)[-2]=>bool(true)}

联合类型2.0

联合类型接受可以是不同类型的值。目前,PHP不支持联合类型,但?Type语法和特殊iterable类型除外。

在PHP 8之前,联合类型只能在phpdoc批注中指定:

class Number {/*** @var int|float $number*/private $number;

/*** @param int|float $number*/public function setNumber($number) {$this->number = $number;}

/*** @return int|float*/public function getNumber() {return $this->number;}}

根据联合类型2.0 RFC提议在函数签名中添加对联合类型的支持,这样我们就不再依赖内联文档,而是使用T1|T2|...语法来定义联合类型:

class Number {private int|float $number;

public function setNumber(int|float $number): void {$this->number = $number;}

public function getNumber(): int|float {return $this->number;}}

联合类型支持所有可用类型,但有一些限制:

void类型不能是并集的一部分,因为void意味着函数不返回任何值。

null类型仅支持union的类型,但它的使用作为一个独立的类型是不允许的。

(?T)也可以使用可为null的类型表示法,表示T|null,但不允许在联合类型中包含该表示法(不允许使用?T1|T2,应该用T1|T2|null改用)。

尽可能多的功能(即strpos(),strstr(),substr()等等)包括false可能的返回类型中,false伪类型也支持。

内部函数的一致类型错误

传递非法类型的参数时,内部函数和用户定义函数的行为会有所不同。

用户定义的函数会引发TypeError,但是内部函数会根据多种情况以多种方式运行。无论如何,典型的行为是发出警告并返回null。比如下面的代码在PHP 7.4会导致告警

var_dump(strlen(new stdClass));
Warning: strlen() expects parameter 1 to be string, object given in /path/to/your/test.php on line 4

NULL

如果启用strict_types,或参数信息指定类型,则行为将有所不同。在这种情况下,将检测到类型错误并导致TypeError。

为了消除这些不一致之处,RFC建议使内部参数解析API在参数类型不匹配的情况下抛出ThrowError。

在PHP 8中,上面的代码将抛出致命错误:

Fatal error: Uncaught TypeError: strlen(): Argument #1 ($str) must be of type string, object given in /path/to/your/test.php:4Stack trace:#0 {main}thrown in /path/to/your/test.php on line 4

抛出表表达式

在PHP中,throw是一个语句,因此无法在只允许使用表达式的地方使用它。

建议将throw语句转换为表达式,这样就可以在允许表达式的任何上下文中使用它。例如,箭头符号,空合并运算符,三元判断和合并运算符等:

$callable = fn() => throw new Exception();

// $value is non-nullable.$value = $nullableValue ?? throw new InvalidArgumentException();

// $value is truthy.$value = $falsableValue ?: throw new InvalidArgumentException();

WeakMap

WeakMap是弱引用键的数据(对象)的集合,这意味着不会阻止对它们的垃圾回收。

PHP 7.4添加了对弱引用的支持,以此作为保留对对象的引用的一种方式,这种引用不会阻止对象本身被破坏。

在长时间运行的进程中,这将防止内存泄漏并提高性能。:

$map = new WeakMap;$obj = new stdClass;$map[$obj] = 42;var_dump($map);

使用PHP 8,上面的代码执行结果如下:

object(WeakMap)#1 (1) {[0]=>array(2) {["key"]=>object(stdClass)#2 (0) {}["value"]=>int(42)}}

如果取消设置对象,则键会自动从弱Map中删除:

unset($obj);var_dump($map);

现在的结果如下:

object(WeakMap)#1 (0) {}

参数列表中的尾部逗号

尾随逗号是附加到不同上下文中的项目列表的逗号。PHP 7.2在列表语法中引入了结尾逗号,PHP 7.3在函数调用中引入了结尾逗号。

PHP 8现在在参数列表中以函数,方法和闭包形式引入尾部逗号,如以下示例所示:

class Foo {public function __construct(string $x,int $y,float $z,) {// do something}}

在对象上允许:: class语法

为了获取类的名称,可以使用Foo\Bar::class语法。建议将相同的语法扩展到对象,以便现在可以获取给定对象的类的名称,如下例所示:

$object = new stdClass;var_dump($object::class); // "stdClass"

$object = null;var_dump($object::class); // TypeError

使用PHP 8,$object::class提供与相同的结果get_class($object)。如果$object不是对象,则抛出TypeError异常。

属性v2

属性,也称为注释,是结构化元数据的一种形式,可用于指定对象,元素或文件的属性。

在PHP 7.4之前,文档注释是将元数据添加到类,函数等的声明中的唯一方法。Attributes v2 RFC引入了PHP属性,这些属性将它们定义为结构化的语法元数据的形式,可以将其添加到类,属性,函数,方法,参数和常量。

将属性添加到它们所引用的声明之前。示例:

<<ExampleAttribute>>class Foo{<<ExampleAttribute>>public const FOO = 'foo';

<<ExampleAttribute>>public $x;

<<ExampleAttribute>>public function foo(<<ExampleAttribute>> $bar) { }}

$object = new <<ExampleAttribute>> class () { };

<<ExampleAttribute>>function f1() { }

$f2 = <<ExampleAttribute>> function () { };

$f3 = <<ExampleAttribute>> fn () => 1;

可以在文档块注释之前或之后添加属性:

<<ExampleAttribute>>/** docblock */<<AnotherExampleAttribute>>function foo() {}

每个声明可以具有一个或多个属性,并且每个属性可以具有一个或多个关联值:

<<WithoutArgument>><<SingleArgument(0)>><<FewArguments('Hello', 'World')>>function foo() {}

新的PHP函数

PHP 8为该语言带来了几个新功能,str_contains,str_starts_with(),str_ends_with()和get_debug_type

str_contains

在PHP 8之前,strstr和strpos是开发人员在给定字符串中搜索针的典型选择。问题是,这两个函数并不是很直观,它们的用法可能会使新人员感到困惑。

$mystring = 'Managed WordPress Hosting';$findme = 'WordPress';$pos = strpos($mystring, $findme);

if ($pos !== false) {echo "The string has been found";} else {echo "String not found";}

在上面的示例中,使用了!==比较运算符,该运算符还检查两个值是否属于同一类型。如果针的位置为0,这可以防止我们出错:

"此函数可能返回布尔FALSE,但也可能返回非布尔值,其值为FALSE。[…]使用===运算符测试此函数的返回值。"

此外,一些框架提供了帮助程序功能来搜索给定字符串内的值(比如Laravel)。

RFC建议引入一个新功能,该功能允许在字符串内部进行搜索:str_contains。

str_contains ( string $haystack , string $needle ) : bool

它的用法非常简单。str_contains检查是否$needle在中找到$haystack并返回true或false相应地返回。使用str_contains可以使用如下语法:

$mystring = 'Managed WordPress Hosting';$findme = 'WordPress';

if (str_contains($mystring, $findme)) {echo "The string has been found";} else {echo "String not found";}

这更易读,更不容易出错。目前str_contains它区分大小写,但是将来可能会改变。

str_starts_with()和str_ends_with()

除此str_contains功能外,还有两个新功能允许在给定的规则搜索:str_starts_with和str_ends_with。检查给定字符串是否以另一个字符串开头或结尾:

str_starts_with (string $haystack , string $needle) : boolstr_ends_with (string $haystack , string $needle) : bool

如果$needle大于$haystack,则两个函数都将返回false。这两个函数都区分大小写:

$str = "WordPress";if (str_starts_with($str, "Word")) echo "Found!";

if (str_starts_with($str, "word")) echo "Not found!";

get_debug_type

get_debug_type是一个新的PHP函数,它返回变量的类型。新函数的工作方式与gettype函数非常相似,但是get_debug_type返回本机类型名称并解析类名称。对于语言来说,这是一个很好的改进,gettype()对类型检查没有用。

RFC提供了两个有用的示例,可以更好地理解新get_debug_type()功能和的区别gettype()。第一个示例显示gettype了工作方式:

$bar = [1,2,3];if (!($bar instanceof Foo)) {throw new TypeError('Expected ' . Foo::class . ', got ' . (is_object($bar) ? get_class($bar) : gettype($bar)));}

在PHP 8中,可以使用get_debug_type,而不是:

if (!($bar instanceof Foo)) {throw new TypeError('Expected ' . Foo::class . ' got ' . get_debug_type($bar));}

下面显示了get_debug_type和gettype的返回值对比:


总结

在本文中,我们介绍了PHP 8发行版中预期的所有关键更改和改进。其中最值得期待的肯定是JIT编译器,还PHP 8还有很多其他功能。希望我们能早日运行新的版本,替换到满是bug的PHP 5.2系统(群里一个PHP 5.2老内存泄露,还不敢升级的人问怎么解决,有感!)。