在 PHP 中写真正的异步代码 TrueAsync 0.6.0 已支持数据库链接池
现代软件的构建最终仍然要回到实践。再复杂的产品,也必须经过真实用户的检验。只有最终用户,才能真正区分哪些设计是有效的、哪些方向值得继续推进。再优雅的架构,如果没有落到真实代码和真实问题里,就很难体现实际价值。
TrueAsync 是一个将原生异步能力带入 PHP 的项目,而且这套能力是直接向语言核心延伸的。0.6.0 是这个项目的一个关键里程碑:这是一个实验性版本,目标是让开发者已经可以开始编写真正的异步代码,并尽可能测试各种极端场景。
从项目推进方式来看,作者希望尽早把工具交到开发者手里,再和社区一起验证哪些设计是可行的、哪些部分还需要调整。因此,这个版本本质上也是一次面向社区的实验邀请。
完全异步化的 PHP Core
0.6.0 中最激进的一项变化,是 PHP 核心已经实现了完整的异步化。
长期以来,PHP 的运行模型一直以同步阻塞为主。一次 I/O 操作往往会直接阻塞当前执行流程,直到操作完成。而在这个版本中,这种情况已经发生了根本变化。
文件 I/O、socket、pipe、STDIO、STDERR、CURL 等能力现在都可以真正并发执行。无论是打开一个进程、读取文件,还是发起 HTTP 请求,这些操作都会运行在内部的 EventLoop 之下。不需要额外包装器,也不需要专门适配器,普通 PHP 函数本身就可以在协程中以异步方式运行。
这件事的难点并不只是"修改 plain_wrapper.c 的行为"这么简单。真正落到 PHP 内部实现时,会涉及相当复杂的内部 API。除此之外,PHP 在启动和关闭阶段仍然必须保持同步,因为异步能力由扩展提供,而扩展本身并不能在所有生命周期阶段运行。这些问题也让版本发布时间一度被推迟了几周。
截至目前,已经有超过 70 个 PHP 标准函数完成适配,包括 file_get_contents()、fread()、curl_exec()、PDO、mysqli、pg_connect()、socket_*、proc_open()、sleep(),甚至还有 ob_start()。在协程内部,这些能力都会自动转为非阻塞执行。
一套新的异步编程 API
在设计 TrueAsync 的 API 时,项目参考了多种流行语言的异步模型,重点目标是提供一套足够顺手、能够解决日常问题的工具集。0.6.0 已经带来了一套接近完整的异步原语集合,和此前 TrueAsync RFC 中出现过的版本并不完全相同。
目前可用的核心能力包括:
Coroutines:通过spawn()启动异步任务Future:一种更便于处理异步结果的 Promise 变体Awaiting:包括await、await_all()、await_first_success()、await_any_of()、delay()、suspend()Channels:通过Channel在协程之间传递数据Cancellation:提供cancel()、protect()、timeout()等一次性取消能力Scope:用于管理一组协程的生命周期TaskGroup/TaskSet:提供结构化并发能力Context:为协程绑定上下文数据iterate():并发处理集合Pool/PDO Pool:资源池与数据库连接池
这类 API 的完整说明更适合直接阅读项目文档:true-async.github.io 。从项目演示来看,像进程池这类过去往往要依赖完整框架组件才能完成的功能,现在可以直接通过这些原语组合实现。
完整变更列表可参考 CHANGELOG。
更深入的 CURL 集成
CURL 这一部分的实现显然是本次发布中最复杂的部分之一。原因在于,CURL 的 API 非常丰富,并且和 PHP 的 I/O 体系耦合得很深。比如,用 CURL 下载文件、上传文件到远程服务器,这些流程过去都严格运行在同步阻塞模型中。现在语言核心已经可以异步执行,那么 CURL 也必须一并纳入这套机制。
下面这个例子演示了如何并行下载 20 个 WordPress 插件。downloadFile 本身只是普通的 curl_init + curl_exec 代码,没有任何显式的异步写法:
php
function downloadFile(string $url, string $savePath): array
{
$fp = fopen($savePath, 'wb');
$ch = curl_init($url);
curl_setopt_array($ch, [
CURLOPT_FILE => $fp,
CURLOPT_FOLLOWLOCATION => true,
CURLOPT_MAXREDIRS => 5,
CURLOPT_TIMEOUT => 120,
CURLOPT_CONNECTTIMEOUT => 10,
CURLOPT_FAILONERROR => true,
]);
$ok = curl_exec($ch);
$error = curl_error($ch);
$info = curl_getinfo($ch);
fclose($fp);
if (!$ok) {
unlink($savePath);
return ['success' => false, 'error' => $error ?: "HTTP {$info['http_code']}"];
}
return [
'success' => true,
'filename' => basename($savePath),
'bytes' => $info['size_download'],
'speed' => round($info['speed_download'] / 1024, 1) . ' KB/s',
];
}
要让这 20 个下载任务并发执行,只需要补几行代码:
php
use Async\TaskGroup;
$group = new TaskGroup();
foreach ($files as $file) {
$group->spawn(downloadFile(...), $file['url'], $downloadDir . '/' . $file['filename']);
}
$results = $group->all();
按照项目给出的说法,这种写法的运行速度可以达到 curl_multi_exec 的两倍,同时语义上也更清晰。它背后的核心原则是:如果一个函数本身执行的是顺序 I/O,那么只要把它放进协程运行,就可以自然获得异步执行能力。
在 Linux 上,文件写入会在可行时使用 IO_URING;在 Windows 上则会走线程池。
PDO Pool:开箱即用的连接池
异步 PHP 里的另一个典型难点,是数据库连接的管理。
作者提到,自己最初探索 PHP 异步编程时,最大的挫败感之一,就是常用数据库驱动很难直接拿来使用。原因在于,数据库连接不能简单在多个协程之间共享:如果两个执行路径同时在同一个 socket 上读写数据,数据流就会互相污染。而如果每个协程都独立新建数据库连接,又会浪费大量资源。MySQL 默认只允许 151 个连接,PostgreSQL 默认允许 100 个。
0.6.0 的一个亮点,是 PDO 现在已经支持内建数据库连接池。
下面先看在协程里直接共享普通 PDO 对象会发生什么:
php
$pdo = new PDO('mysql:host=localhost;dbname=app', 'root', 'secret');
// Ten coroutines sharing a single $pdo
for ($i = 0; $i < 10; $i++) {
spawn(function() use ($pdo, $i) {
$pdo->beginTransaction();
$pdo->exec("INSERT INTO orders (user_id) VALUES ($i)");
// Another coroutine already called COMMIT on this same connection!
$pdo->commit(); // Chaos
});
}
这里的 10 个协程实际上共享的是同一个 socket。事务会互相交错,数据会丢失,一个协程的 COMMIT 甚至可能提交另一个协程的改动,这本质上就是典型的数据竞争。
而启用连接池之后,行为就完全不同:
php
$pdo = new PDO('mysql:host=localhost;dbname=app', 'root', 'secret', [
PDO::ATTR_POOL_ENABLED => true,
PDO::ATTR_POOL_MIN => 2,
PDO::ATTR_POOL_MAX => 10,
]);
// Ten coroutines, each gets its own connection
for ($i = 0; $i < 10; $i++) {
spawn(function() use ($pdo, $i) {
// The pool automatically assigns a connection to this coroutine
$pdo->beginTransaction();
$pdo->exec("INSERT INTO orders (user_id) VALUES ($i)");
$pdo->commit();
// The connection returns to the pool
});
}
开发者只需要在创建对象时增加几个参数,剩下的交给池本身处理即可。连接池会自动为每个协程分配独立连接,并在协程结束后归还。事务天然隔离;如果某个协程结束前没有显式调用 commit(),连接池还会自动执行回滚。
此外,PDO Pool 还支持自定义 CircuitBreakerStrategy,用于在数据库出现异常时更平滑地限制负载;也支持 POOL_HEALTHCHECK_INTERVAL,用于检测并销毁池中的空闲连接。
更多细节可以参考项目中的 PDO Pool 文档说明。
如何试用
PHP TrueAsync 已经可以在主流平台上使用。最快的试用方式仍然是 Docker:
bash
docker pull trueasync/php-true-async:0.6.0-php8.6
docker run --rm trueasync/php-true-async:0.6.0-php8.6 php -v
在 Linux 和 macOS 上,也可以通过安装脚本从源码编译 PHP:
bash
# Linux (Ubuntu/Debian)
curl -fsSL https://raw.githubusercontent.com/true-async/releases/master/installer/build-linux.sh | bash
# macOS (requires Homebrew)
curl -fsSL https://raw.githubusercontent.com/true-async/releases/master/installer/build-macos.sh | bash
安装流程会通过交互式向导完成,包括扩展选择、安装路径和 PATH 配置。对于 CI 或脚本环境,项目也提供了基于环境变量的非交互模式。
在 Windows 上,则可以直接通过 PowerShell 安装预编译二进制:
powershell
irm https://raw.githubusercontent.com/true-async/releases/master/installer/install.ps1 | iex
php-community RFC:面向所有人的实验性 PHP
除 0.6.0 版本本身外,原文也提到了另一个值得关注的方向:php-community RFC。
目前负责 RFC 流程的 Daniil Gentili 提出了一份文档,目标是建立一个带有实验性特性的官方 PHP 分支,即 php-community。它会采用日期型版本号,例如 php-community 2026.03.01,并按月发布更新。
这一思路的核心在于:像异步能力、新的标准库函数、实验性优化器这类重大语言特性,可以作为内建的 feature extension 交付,具备独立版本号、默认关闭,并允许开发者用一行配置完成启用。
如果这一机制能够成立,它有机会消除实验性特性推广中最常见的障碍:安装复杂度。对于 TrueAsync 而言,这也可能成为面向更广泛 PHP 开发者交付异步能力的一条自然路径,甚至不必等到最终 RFC 正式落地之后才开始大规模验证。
接下来:0.7.0
从项目路线来看,接下来的版本重点会继续放在稳定性、性能和兼容性上。当前在 0.6.0 中引入的 API 未来仍然可能调整,但其整体设计方向大概率不会发生大的变化。
参与项目
TrueAsync 仍然是一个开放项目,社区可以通过多种方式参与推进。并不一定需要直接编写 C 代码,项目中的大量测试本身就是用 PHP 编写的。
在当前阶段,测试仍然是验证和改进 API 最重要的工具之一。对于一个仍处于实验阶段、但已经开始走向真实应用场景的异步运行时来说,越早在真实项目与真实边界条件中暴露问题,就越有助于后续版本收敛。