目 录
-
- 摘要
- [1. 引言](#1. 引言)
- [2. Gateway 架构概述](#2. Gateway 架构概述)
-
- [2.1 整体架构设计](#2.1 整体架构设计)
- [2.2 核心组件详解](#2.2 核心组件详解)
-
- [2.2.1 消息接收器](#2.2.1 消息接收器)
- [2.2.2 安全认证层](#2.2.2 安全认证层)
- [2.2.3 会话管理器](#2.2.3 会话管理器)
- [2.2.4 路由引擎](#2.2.4 路由引擎)
- [2.3 数据流转过程](#2.3 数据流转过程)
- [3. 启动配置详解](#3. 启动配置详解)
-
- [3.1 配置文件结构](#3.1 配置文件结构)
- [3.2 环境变量覆盖](#3.2 环境变量覆盖)
- [3.3 启动命令详解](#3.3 启动命令详解)
- [3.4 启动参数配置表](#3.4 启动参数配置表)
- [4. 停止策略(优雅关闭)](#4. 停止策略(优雅关闭))
-
- [4.1 优雅关闭的重要性](#4.1 优雅关闭的重要性)
- [4.2 Gateway 关闭流程](#4.2 Gateway 关闭流程)
- [4.3 优雅关闭实现](#4.3 优雅关闭实现)
- [4.4 停止命令与超时配置](#4.4 停止命令与超时配置)
- [5. 监控方案](#5. 监控方案)
-
- [5.1 监控体系架构](#5.1 监控体系架构)
- [5.2 健康检查](#5.2 健康检查)
- [5.3 Prometheus 指标](#5.3 Prometheus 指标)
- [5.4 Grafana 监控面板](#5.4 Grafana 监控面板)
- [6. 故障排查](#6. 故障排查)
-
- [6.1 常见问题诊断](#6.1 常见问题诊断)
- [6.2 日志分析技巧](#6.2 日志分析技巧)
- [7. 高可用部署](#7. 高可用部署)
-
- [7.1 多实例部署架构](#7.1 多实例部署架构)
- [7.2 负载均衡配置](#7.2 负载均衡配置)
- [7.3 会话共享方案](#7.3 会话共享方案)
- [7.4 高可用部署检查清单](#7.4 高可用部署检查清单)
- [8. 生产环境最佳实践](#8. 生产环境最佳实践)
-
- [8.1 安全加固](#8.1 安全加固)
- [8.2 性能优化](#8.2 性能优化)
- [8.3 运维建议](#8.3 运维建议)
- [9. 总结](#9. 总结)
- 参考资料
摘要
本文深入探讨 OpenClaw Gateway 服务的核心架构与运维实践。作为 OpenClaw 框架的中枢神经,Gateway 承担着消息路由、会话管理、安全认证等关键职责。文章从架构设计出发,详细解析启动配置参数、优雅停止策略、监控方案实现,并结合生产环境经验,提供故障排查指南与高可用部署最佳实践。通过本文,读者将全面掌握 Gateway 服务的运维技能,构建稳定可靠的 AI 助手基础设施。
1. 引言
在现代 AI 助手架构中,网关服务扮演着至关重要的角色。它不仅是系统对外的统一入口,更是内部各组件协调运转的核心枢纽。OpenClaw Gateway 正是这样一款专为 AI 助手场景设计的网关服务,它将多渠道消息接入、会话状态管理、安全认证、流量控制等功能集于一身,为开发者提供开箱即用的基础设施。
Gateway 服务的稳定性直接决定了整个 AI 助手系统的可用性。一个设计良好的网关,能够在高并发场景下保持稳定响应,在异常情况下优雅降级,在故障发生时快速恢复。本文将从实践角度出发,系统性地介绍 OpenClaw Gateway 的启动配置、停止策略、监控方案,帮助读者构建生产级的 AI 助手服务。
2. Gateway 架构概述
2.1 整体架构设计
OpenClaw Gateway 采用模块化的微服务架构设计,核心组件包括消息接收器、会话管理器、路由引擎、安全认证层和监控采集器。各组件之间通过定义良好的接口进行通信,既保证了系统的灵活性,又确保了组件的可替换性。
📊 监控层
🤖 内部服务
⚙️ Gateway 核心层
🌐 外部渠道
Telegram
飞书
Discord
微信
消息接收器
安全认证层
会话管理器
路由引擎
AI 引擎
技能系统
工具执行器
指标采集器
日志聚合
告警系统
从架构图可以看出,Gateway 处于系统的核心位置,所有外部消息都必须经过 Gateway 的处理后才能到达内部服务。这种设计带来了几个显著优势:
统一入口管理:所有渠道的消息通过统一接口接入,便于实施统一的认证、限流、日志等策略。
松耦合设计:外部渠道与内部服务解耦,新增渠道或修改服务逻辑互不影响。
可观测性:监控层独立部署,可全面采集系统运行指标,为故障排查提供数据支撑。
2.2 核心组件详解
2.2.1 消息接收器
消息接收器负责处理来自不同渠道的消息请求。它实现了多协议适配,支持 HTTP、WebSocket、gRPC 等多种通信协议。接收器将各渠道的原始消息格式统一转换为 OpenClaw 内部消息格式,屏蔽了渠道差异。
2.2.2 安全认证层
安全认证层实现了多层安全机制。首先是 Token 认证,每个请求必须携带有效的认证令牌;其次是签名验证,确保消息在传输过程中未被篡改;最后是权限校验,根据用户身份限制可访问的资源。
2.2.3 会话管理器
会话管理器维护着所有活跃会话的状态信息。它支持会话的创建、更新、查询和销毁操作,并实现了会话超时自动清理机制。会话数据可选择存储在内存、Redis 或数据库中,以适应不同规模的部署需求。
2.2.4 路由引擎
路由引擎是 Gateway 的决策中心。它根据消息类型、用户意图、技能配置等信息,将消息路由到正确的处理单元。路由引擎支持优先级配置、负载均衡和故障转移策略。
2.3 数据流转过程
技能系统 AI引擎 Gateway 外部渠道 用户 技能系统 AI引擎 Gateway 外部渠道 用户 alt [技能匹配成功] [需要AI处理] 发送消息 Webhook 推送 1. 消息解析 2. 安全认证 3. 会话查询/创建 4. 路由决策 调用技能处理器 返回处理结果 发送AI请求 返回AI响应 5. 响应格式化 返回响应消息 展示给用户
3. 启动配置详解
3.1 配置文件结构
OpenClaw Gateway 的配置采用 YAML 格式,配置文件通常位于 ~/.openclaw/config.yaml。配置项分为全局配置、Gateway 配置、模型配置、渠道配置等几个主要部分。
yaml
# OpenClaw Gateway 完整配置示例
# 全局配置
openclaw:
# Gateway 服务配置
gateway:
port: 18789 # 服务监听端口
host: "0.0.0.0" # 绑定地址,0.0.0.0 表示所有网卡
auth_token: "your-secret-token" # 认证令牌(必填,建议32位以上)
max_connections: 1000 # 最大并发连接数
request_timeout: 30000 # 请求超时时间(毫秒)
enable_https: false # 是否启用 HTTPS
ssl_cert: "/path/to/cert.pem" # SSL 证书路径
ssl_key: "/path/to/key.pem" # SSL 私钥路径
# 会话管理配置
session:
storage: "memory" # 存储类型:memory/redis/sqlite
ttl: 3600 # 会话超时时间(秒)
max_sessions: 10000 # 最大会话数
cleanup_interval: 300 # 清理间隔(秒)
# 日志配置
logging:
level: "info" # 日志级别:debug/info/warn/error
format: "json" # 日志格式:json/text
output: "/var/log/openclaw/gateway.log" # 日志文件路径
max_size: 100 # 单文件最大大小(MB)
max_backups: 10 # 最大备份文件数
max_age: 30 # 最大保留天数
# 监控配置
monitoring:
enabled: true # 是否启用监控
metrics_port: 9090 # 指标暴露端口
health_check_path: "/health" # 健康检查路径
prometheus: true # 是否启用 Prometheus 格式
上述配置文件展示了 Gateway 的核心配置项。gateway 部分定义了服务的基本参数,包括端口、认证令牌、连接限制等。session 部分配置会话存储策略,可根据部署规模选择合适的存储后端。logging 部分控制日志输出,生产环境建议使用 JSON 格式便于日志聚合。monitoring 部分开启监控指标暴露,支持 Prometheus 采集。
3.2 环境变量覆盖
除了配置文件,Gateway 还支持通过环境变量覆盖配置项。环境变量名采用 OPENCLAW_ 前缀,层级关系用双下划线连接。例如:
bash
# 设置 Gateway 端口
export OPENCLAW_GATEWAY_PORT=8080
# 设置认证令牌
export OPENCLAW_GATEWAY_AUTH_TOKEN="production-token-xxx"
# 设置日志级别
export OPENCLAW_LOGGING_LEVEL=debug
# 设置会话存储类型
export OPENCLAW_SESSION_STORAGE=redis
环境变量覆盖机制在容器化部署场景中尤为实用。通过环境变量注入敏感配置(如认证令牌、数据库密码),可以避免将敏感信息写入配置文件,降低安全风险。
3.3 启动命令详解
OpenClaw 提供了 openclaw gateway 命令组来管理 Gateway 服务:
bash
# 查看 Gateway 服务状态
openclaw gateway status
# 前台启动 Gateway(调试用)
openclaw gateway start
# 后台启动 Gateway(生产环境推荐)
openclaw gateway start --daemon
# 使用指定配置文件启动
openclaw gateway start --config /path/to/config.yaml
# 停止 Gateway 服务
openclaw gateway stop
# 重启 Gateway 服务
openclaw gateway restart
# 查看 Gateway 帮助信息
openclaw gateway --help
3.4 启动参数配置表
| 参数 | 默认值 | 说明 | 推荐值 |
|---|---|---|---|
port |
18789 | 服务监听端口 | 生产环境建议使用 80/443 |
host |
0.0.0.0 | 绑定地址 | 内网部署可绑定内网 IP |
auth_token |
- | 认证令牌 | 32位以上随机字符串 |
max_connections |
1000 | 最大并发连接 | 根据服务器配置调整 |
request_timeout |
30000 | 请求超时(ms) | AI 场景建议 60s 以上 |
session.ttl |
3600 | 会话超时(s) | 根据业务需求调整 |
logging.level |
info | 日志级别 | 生产环境 info,调试 debug |
4. 停止策略(优雅关闭)
4.1 优雅关闭的重要性
在生产环境中,服务的停止操作绝非简单的进程终止。一个设计良好的停止策略需要考虑以下几个关键问题:
请求完整性:正在处理的请求不能被中断,必须等待其完成或超时。
资源释放:数据库连接、文件句柄、网络连接等资源需要正确释放,避免资源泄漏。
状态持久化:会话状态、缓存数据等需要持久化保存,确保服务重启后能恢复现场。
下游通知:需要通知下游服务即将下线,避免流量继续路由到已停止的实例。
4.2 Gateway 关闭流程
是
否
否
是
收到停止信号
停止接收新请求
等待现有请求完成
所有请求是否完成?
持久化会话状态
是否超时?
强制终止请求
释放资源连接
通知下游服务
关闭监控端口
写入关闭日志
进程退出
4.3 优雅关闭实现
OpenClaw Gateway 实现了完整的优雅关闭机制。当收到 SIGTERM 或 SIGINT 信号时,Gateway 会按照以下步骤执行关闭:
python
# Gateway 优雅关闭核心逻辑(伪代码示意)
import signal
import asyncio
from typing import Set
class GatewayServer:
def __init__(self):
self.active_requests: Set[asyncio.Task] = set()
self.shutdown_event = asyncio.Event()
self.graceful_timeout = 30 # 优雅关闭超时时间(秒)
def setup_signal_handlers(self):
"""注册信号处理器"""
loop = asyncio.get_event_loop()
for sig in (signal.SIGTERM, signal.SIGINT):
loop.add_signal_handler(
sig,
lambda: asyncio.create_task(self.graceful_shutdown())
)
async def graceful_shutdown(self):
"""优雅关闭主流程"""
self.logger.info("开始优雅关闭...")
# 1. 停止接收新请求
self.server.close()
self.logger.info("已停止接收新请求")
# 2. 等待现有请求完成
if self.active_requests:
self.logger.info(f"等待 {len(self.active_requests)} 个请求完成...")
try:
await asyncio.wait_for(
asyncio.gather(*self.active_requests, return_exceptions=True),
timeout=self.graceful_timeout
)
except asyncio.TimeoutError:
self.logger.warning("优雅关闭超时,强制终止剩余请求")
# 3. 持久化会话状态
await self.session_manager.persist_sessions()
self.logger.info("会话状态已持久化")
# 4. 释放资源
await self.resource_pool.close_all()
self.logger.info("资源已释放")
# 5. 设置关闭事件
self.shutdown_event.set()
self.logger.info("Gateway 已安全关闭")
上述代码展示了 Gateway 优雅关闭的核心逻辑。首先注册信号处理器,捕获 SIGTERM 和 SIGINT 信号。当收到停止信号时,依次执行:停止接收新请求、等待现有请求完成、持久化会话状态、释放资源连接。整个过程设置了超时保护,避免无限等待导致服务无法停止。
4.4 停止命令与超时配置
bash
# 正常停止(优雅关闭)
openclaw gateway stop
# 强制停止(立即终止)
openclaw gateway stop --force
# 设置优雅关闭超时时间
openclaw gateway stop --timeout 60
# 停止并保存会话状态
openclaw gateway stop --save-session
5. 监控方案
5.1 监控体系架构
完善的监控体系是保障服务稳定性的基石。OpenClaw Gateway 的监控方案包含三个层次:健康检查、指标采集、日志聚合。
🚨 告警
📊 可视化
💾 数据存储
📡 数据采集
健康检查端点
Prometheus 指标
日志输出
Prometheus
Loki/ES
Grafana
AlertManager
5.2 健康检查
Gateway 提供了标准的健康检查端点,用于负载均衡器和服务编排系统(如 Kubernetes)探测服务状态。
bash
# 健康检查端点
GET /health
# 返回示例
{
"status": "healthy",
"timestamp": "2024-01-15T10:30:00Z",
"version": "1.2.0",
"uptime": 86400,
"components": {
"database": "healthy",
"redis": "healthy",
"ai_engine": "healthy"
}
}
# 就绪检查端点(Kubernetes Readiness Probe)
GET /ready
# 存活检查端点(Kubernetes Liveness Probe)
GET /live
健康检查返回的信息包括服务状态、启动时间、运行时长以及各组件的健康状态。负载均衡器可以根据 /health 或 /ready 的返回结果决定是否将流量路由到该实例。
5.3 Prometheus 指标
Gateway 内置了丰富的 Prometheus 指标,涵盖请求量、延迟、错误率、资源使用等维度。
yaml
# Prometheus 抓取配置示例
scrape_configs:
- job_name: 'openclaw-gateway'
static_configs:
- targets: ['localhost:9090']
metrics_path: '/metrics'
scrape_interval: 15s
核心指标列表:
| 指标名称 | 类型 | 说明 |
|---|---|---|
openclaw_requests_total |
Counter | 请求总数 |
openclaw_request_duration_seconds |
Histogram | 请求延迟分布 |
openclaw_active_sessions |
Gauge | 活跃会话数 |
openclaw_errors_total |
Counter | 错误总数 |
openclaw_webhook_latency_seconds |
Histogram | Webhook 延迟 |
openclaw_ai_request_duration_seconds |
Histogram | AI 请求延迟 |
openclaw_connections_current |
Gauge | 当前连接数 |
5.4 Grafana 监控面板
配合 Grafana,可以构建直观的监控面板。以下是一个典型的 Gateway 监控面板配置:
json
{
"dashboard": {
"title": "OpenClaw Gateway 监控",
"panels": [
{
"title": "请求 QPS",
"type": "graph",
"targets": [
{
"expr": "rate(openclaw_requests_total[5m])",
"legendFormat": "{{method}} - {{channel}}"
}
]
},
{
"title": "请求延迟 P99",
"type": "stat",
"targets": [
{
"expr": "histogram_quantile(0.99, rate(openclaw_request_duration_seconds_bucket[5m]))"
}
]
},
{
"title": "错误率",
"type": "gauge",
"targets": [
{
"expr": "rate(openclaw_errors_total[5m]) / rate(openclaw_requests_total[5m]) * 100"
}
]
}
]
}
}
6. 故障排查
6.1 常见问题诊断
在生产环境中,Gateway 可能遇到各种问题。本节整理了常见问题的诊断方法和解决方案。
问题一:服务无法启动
症状 :执行 openclaw gateway start 后服务立即退出。
诊断步骤:
bash
# 1. 查看详细日志
openclaw gateway start --log-level debug
# 2. 检查端口占用
lsof -i :18789
# 3. 检查配置文件语法
openclaw gateway config validate
# 4. 检查权限
ls -la ~/.openclaw/
常见原因及解决方案:
| 原因 | 解决方案 |
|---|---|
| 端口被占用 | 更换端口或停止占用进程 |
| 配置文件语法错误 | 使用 config validate 检查 |
| 权限不足 | 检查配置目录权限 |
| 依赖服务未启动 | 先启动 Redis/数据库等依赖 |
问题二:请求超时
症状:客户端请求长时间无响应,最终返回超时错误。
诊断步骤:
bash
# 1. 检查 Gateway 日志
tail -f /var/log/openclaw/gateway.log | grep timeout
# 2. 检查 AI 引擎状态
curl http://localhost:18789/health
# 3. 检查网络连通性
ping your-ai-service.com
# 4. 查看当前连接数
netstat -an | grep 18789 | wc -l
解决方案:
- 增加请求超时时间配置
- 检查 AI 服务响应时间
- 优化网络链路
- 增加服务器资源
问题三:内存持续增长
症状:Gateway 进程内存占用持续增长,最终触发 OOM。
诊断步骤:
bash
# 1. 监控内存使用
watch -n 1 'ps aux | grep openclaw'
# 2. 分析内存分布
curl http://localhost:9090/metrics | grep memory
# 3. 检查会话数量
curl http://localhost:18789/admin/sessions/count
# 4. 开启 pprof 分析
openclaw gateway start --enable-pprof
解决方案:
- 减小会话 TTL
- 降低最大会话数限制
- 启用会话持久化(减少内存占用)
- 检查是否存在内存泄漏
6.2 日志分析技巧
Gateway 日志采用结构化格式,便于使用日志分析工具进行处理。
bash
# 查看最近错误日志
cat gateway.log | jq 'select(.level=="error")'
# 统计各渠道请求量
cat gateway.log | jq -r '.channel' | sort | uniq -c
# 分析慢请求(超过 5 秒)
cat gateway.log | jq 'select(.duration > 5000)'
# 按时间范围过滤
cat gateway.log | jq 'select(.timestamp >= "2024-01-15T10:00:00" and .timestamp < "2024-01-15T11:00:00")'
7. 高可用部署
7.1 多实例部署架构
生产环境通常需要部署多个 Gateway 实例,通过负载均衡器分发流量,实现高可用和水平扩展。
🤖 AI 服务
💾 共享存储
🔄 Gateway 集群
⚖️ 负载均衡层
👥 客户端
Telegram 用户
飞书用户
Discord 用户
Nginx/HAProxy
Gateway-1
Gateway-2
Gateway-3
Redis 集群
数据库
AI 引擎
7.2 负载均衡配置
使用 Nginx 作为负载均衡器的配置示例:
nginx
# Nginx 负载均衡配置
upstream openclaw_gateway {
# 使用最少连接算法
least_conn;
# Gateway 实例列表
server 192.168.1.101:18789 weight=1 max_fails=3 fail_timeout=30s;
server 192.168.1.102:18789 weight=1 max_fails=3 fail_timeout=30s;
server 192.168.1.103:18789 weight=1 max_fails=3 fail_timeout=30s;
# 健康检查(需要 nginx-plus 或 tengine)
check interval=3000 rise=2 fall=3 timeout=1000 type=http;
check_http_send "GET /health HTTP/1.0\r\n\r\n";
check_http_expect_alive http_2xx http_3xx;
}
server {
listen 80;
server_name gateway.openclaw.ai;
# 请求体大小限制
client_max_body_size 10m;
# 超时配置
proxy_connect_timeout 60s;
proxy_send_timeout 60s;
proxy_read_timeout 60s;
location / {
proxy_pass http://openclaw_gateway;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header X-Forwarded-Proto $scheme;
}
}
上述 Nginx 配置实现了 Gateway 集群的负载均衡。关键配置说明:least_conn 指令使用最少连接算法,将请求分发到当前连接数最少的实例;max_fails 和 fail_timeout 配置实例健康检查,连续 3 次失败后暂时剔除;check 指令配置主动健康检查,定期探测 /health 端点。
7.3 会话共享方案
多实例部署时,会话状态需要共享存储。Gateway 支持将会话存储在 Redis 中:
yaml
# 会话 Redis 存储配置
session:
storage: "redis"
redis:
host: "redis-cluster.openclaw.internal"
port: 6379
password: "${REDIS_PASSWORD}"
db: 0
pool_size: 50
key_prefix: "openclaw:session:"
ttl: 3600
7.4 高可用部署检查清单
| 检查项 | 要求 | 验证方法 |
|---|---|---|
| 多实例部署 | 至少 2 个实例 | openclaw gateway status |
| 负载均衡 | 配置健康检查 | 手动停止实例观察流量切换 |
| 会话共享 | 使用 Redis 存储 | 重启实例后会话保持 |
| 数据库高可用 | 主从/集群部署 | 模拟数据库故障 |
| 监控告警 | 配置关键指标告警 | 触发告警测试 |
| 日志聚合 | 集中存储日志 | 检查日志平台 |
| 备份策略 | 定期备份配置和数据 | 恢复演练 |
8. 生产环境最佳实践
8.1 安全加固
生产环境的 Gateway 必须进行安全加固,防止未授权访问和攻击。
yaml
# 安全配置示例
security:
# 认证配置
auth:
enabled: true
token_rotation_days: 30 # 令牌轮换周期
# 限流配置
rate_limit:
enabled: true
requests_per_minute: 100
burst: 20
# IP 白名单
ip_whitelist:
enabled: true
allowed:
- "10.0.0.0/8"
- "172.16.0.0/12"
# HTTPS 配置
tls:
enabled: true
cert_path: "/etc/ssl/certs/gateway.pem"
key_path: "/etc/ssl/private/gateway.key"
min_version: "TLS1.2"
8.2 性能优化
yaml
# 性能优化配置
performance:
# 连接池配置
connection_pool:
max_idle: 100
max_open: 200
idle_timeout: 300
# 缓存配置
cache:
enabled: true
type: "redis"
ttl: 300
# 并发配置
concurrency:
max_workers: 100
queue_size: 1000
8.3 运维建议
部署规范:
- 使用配置管理工具(Ansible/Terraform)管理配置
- 配置文件版本控制,变更可追溯
- 使用容器化部署,保证环境一致性
监控规范:
- 设置关键指标告警阈值
- 配置多级告警渠道(邮件/短信/IM)
- 定期检查监控面板
备份规范:
- 定期备份配置文件和会话数据
- 定期进行恢复演练
- 异地备份关键数据
9. 总结
本文系统性地介绍了 OpenClaw Gateway 服务的启动、停止和监控实践。从架构设计到配置详解,从优雅关闭到监控方案,从故障排查到高可用部署,我们全面覆盖了 Gateway 运维的各个环节。
核心要点回顾:
-
架构设计:Gateway 采用模块化设计,消息接收器、安全认证层、会话管理器、路由引擎各司其职,通过清晰的接口协作,实现了高内聚低耦合的架构目标。
-
启动配置:配置文件采用 YAML 格式,支持环境变量覆盖。生产环境需要重点关注端口配置、认证令牌、会话存储、日志级别等参数的合理设置。
-
优雅关闭:Gateway 实现了完整的优雅关闭机制,包括停止接收新请求、等待现有请求完成、持久化会话状态、释放资源连接等步骤,确保服务停止过程平滑可控。
-
监控方案:通过健康检查端点、Prometheus 指标、日志聚合三层监控体系,实现了对 Gateway 运行状态的全面可观测性,为故障发现和排查提供了有力支撑。
-
高可用部署:多实例部署配合负载均衡器,会话共享使用 Redis 存储,构建了具备故障转移能力的高可用架构。
实践建议:
- 在部署前充分测试配置参数,确保符合业务需求
- 建立完善的监控告警体系,做到问题早发现早处理
- 定期进行故障演练,验证高可用方案的有效性
- 持续关注性能指标,及时优化瓶颈点
Gateway 作为 OpenClaw 的核心组件,其稳定性直接影响整个 AI 助手系统的可用性。希望本文能帮助读者建立起对 Gateway 运维的全面认识,在实际工作中构建稳定可靠的服务基础设施。