版本:v2.0 · 更新时间:2026-03-15
适用对象:商户、运营、产品团队
订单进来
│
▼
┌─────────────────────────────────────┐
│ 第一阶段:规则引擎 │
│ 按业务规则过滤明显不合适的通道 │
│ 结果:得到一个"候选通道池" │
└────────────────┬────────────────────┘
│
▼
┌─────────────────────────────────────┐
│ 第二阶段:AI 决策引擎 │
│ 对候选通道池进行 AI 评分和融合打分 │
│ 结果:选出当前最优通道 │
└────────────────┬────────────────────┘
│
▼
返回最优通道,发起支付条件:检查通道的某个指标是否满足阈值
逻辑:多个条件之间是 AND(全部满足)还是 OR(任一满足)
动作:满足条件时对通道做什么处理| 逻辑类型 | 说明 | 典型场景 |
|---|---|---|
AND 全部满足 | 所有条件都成立,规则才触发 | "成功率低 且 响应慢"才过滤,避免误伤 |
OR 任一满足 | 任意一个条件成立,规则即触发 | "成功率低 或 AI分低"就过滤,更宽松 |
| 字段 | 时间窗口 | 数据来源 | 推荐场景 |
|---|---|---|---|
success_rate_1m | 近 1 分钟 | 实时滑动窗口计算 | 紧急异常快速响应,敏感度最高 |
success_rate_5m | 近 5 分钟 | 实时滑动窗口计算 | 日常首选,兼顾实时性与稳定性 |
success_rate_10m | 近 10 分钟 | 实时滑动窗口计算 | 中等敏感度规则 |
success_rate_30m | 近 30 分钟 | 实时滑动窗口计算 | 持续性低成功率检测 |
success_rate_1h | 近 1 小时 | 数据库聚合统计 | 综合评估,AI评分的核心输入 |
success_rate_6h | 近 6 小时 | 数据库聚合统计 | 夜间等周期性规则 |
success_rate_24h | 近 24 小时 | 数据库聚合统计 | 长期稳定性基准 |
成功率值范围 0~1,支持百分比写法, "80%"与"0.8"等效。
| 字段 | 说明 |
|---|---|
ai_score | AI 综合评分(0~100分),由 AI 引擎每60秒计算一次 |
| 字段 | 说明 |
|---|---|
channel_status | 通道状态:1=启用,0=停用 |
weight | 商户对该通道设置的权重(1~100) |
pay_way_code | 通道支持的支付方式列表 |
| 字段 | 说明 |
|---|---|
order_amount | 本笔订单金额(单位:元) |
order_hour | 当前小时(0~23),支持跨零点时间段 |
| 动作 | 说明 | 典型使用场景 |
|---|---|---|
| 过滤(exclude) | 将命中条件的通道从候选池移除 | 成功率过低、不支持该支付方式 |
| 白名单路由(include_only) | 只允许指定通道参与决策,其余全部排除 | 大额订单走专属VIP通道 |
| 轮询切换(rotation) | 按金额或失败次数阈值在通道间轮流切换 | 平衡多通道流量分配、规避单通道限额 |
① 平台全局规则(对所有商户生效)优先执行
↓
② 商户专属规则(仅对指定商户生效)后执行
↓
③ 同类规则内按优先级从高到低执行
↓
④ 前一条规则已过滤的通道,不会被后续规则重复处理条件:success_rate_5m < 80%
逻辑:AND
动作:过滤
说明:5分钟内成功率低于80%说明通道正在抖动,直接移出候选池条件:order_amount ≥ 5000
逻辑:AND
动作:白名单路由 → 指定 VIP通道A、VIP通道B
说明:大额资金对稳定性要求更高,强制走高质量专属通道条件:success_rate_1h < 85% AND ai_score < 50
时间:22:00 ~ 06:00,每天生效
动作:过滤
说明:夜间运营人员值守少,加强过滤条件,减少人工干预需求条件:success_rate_5m < 50% OR success_rate_1h < 70%
逻辑:OR(任一满足即触发)
动作:过滤
说明:短期急剧恶化(5min)或长期持续差(1h)都会被识别并过滤条件:(无条件,持续生效)
动作:轮询切换
轮询类型:当日累计金额超过 10万元 时切换到下一条通道
冷却时间:5分钟内不重复触发切换
说明:避免单通道承载过多金额,规避限额和风控AI评分 =
成功率得分 × 50% ← 最重要:通道的支付成功率
+ 响应速度得分 × 25% ← 付款有多快
+ 稳定性趋势得分 × 15% ← 近期是在变好还是变差
+ 近期活跃度得分 × 10% ← 是否有足够的样本支撑评估
- 连续失败惩罚(最高扣15分)
- P95高延迟惩罚(最高扣10分)
- 风控系统推送可能会存在异常的通道(最高扣80分)| 时间窗口 | 权重 |
|---|---|
| 近 1 小时 | 50% |
| 近 6 小时 | 25% |
| 近 24 小时 | 15% |
| 兜底基准值 | 10% |
| 平均响应时间 | 得分 |
|---|---|
| 0 ~ 300ms | 100分(优秀) |
| 300 ~ 800ms | 85 ~ 100分 |
| 800 ~ 1500ms | 70 ~ 85分 |
| 1500 ~ 3000ms | 45 ~ 70分 |
| 3000 ~ 5000ms | 20 ~ 45分 |
| > 5000ms | 0分(不可接受) |
近1小时成功率 ≥ 近24小时成功率 → 100分(近期表现更好,趋势向好)
近1小时成功率 < 近24小时成功率 → 按差值线性扣分,最低保底20分(近期在变差)近1小时订单数 ≥ 5笔 → 按对数曲线计算活跃度得分(0~100)
近1小时订单数 < 5笔 → 固定50分(中等水平,不惩罚新通道)最终融合评分 =
AI评分 × 60% ← 核心,反映通道实时质量
+ 通道权重得分 × 20% ← 商户对各通道的偏好配置
+ 费率得分 × 10% ← 费率越低得分越高(成本优化)
+ 随机扰动 × 10% ← 防止流量完全集中到同一通道大额保护 模式正常情况 → AI决策最优通道
所有通道被过滤 → 从未熔断通道中随机兜底(标注降级标 志)
所有通道熔断 → 从全部通道中随机兜底(标注降级标志)收集近1小时全部路由结果数据
↓
计算当前权重下的预测误差(实际成功率 vs 目标95%)
↓
沿误差梯度方向微调四维权重
↓
归一化确保四维之和 = 1.0,写入 Redis 并持久化历史
↓
下一轮评分计算使用新权重[0.05, 0.80],防止某一维度过度主导导致评分失衡。训练样本不足100笔时自动跳过本轮训练,避免小样本带来噪声。| 触发条件 | 默认阈值 | 说明 |
|---|---|---|
| 近5分钟成功率过低 | < 30%(且样本 ≥ 10笔) | 通道正在大量失败 |
| 近1小时平均响应超限 | > 5000ms | 通道严重超时 |
| 近1小时P95延迟超限 | > 8000ms | 尾延迟过高,体验差 |
| 24小时内第几次熔断 | 熔断时长 |
|---|---|
| 第 1 次 | 10 分钟 |
| 第 2 次 | 20 分钟 |
| 第 3 次 | 40 分钟 |
| 第 4 次及以上 | 2 小时(上限) |
熔断到期
↓
进入半开状态,接入少量真实流量试探
├── 连续 3 笔支付成功 → 完全恢复,重新纳入正常路由
└── 任意 1 笔支付失败 → 立即重新熔断(熔断次数继续累加)① 每笔订单路由到某通道,发起支付
↓
② 支付完成后,结果(成功/失败/超时关单)回写给系统
↓
③ 成功/失败结果进入 Redis 实时滑动窗口,立即影响成功率指标
↓
④ 每60秒,AI 引擎重新计算所有通道评分,写入 Redis
↓
⑤ 每小时,梯度下降训练优化四维权重
↓
⑥ 下一笔订单路由时,使用最新评分做决策| 指标 | 说明 |
|---|---|
| 路由决策延迟 | 每笔订单路由耗时 ≤ 10ms,对支付链路无感知 |
| 评分刷新频率 | 每60秒全量刷新所有通道评分 |
| 实时成功率感知 | 最短1分钟内感知通道质量变化 |
| 熔断响应时间 | 5分钟内自动识别并隔离异常通道 |
| 权重优化周期 | 每1小时自动完成一轮梯度下降训练 |
| 决策可追溯性 | 每笔路由决策全量记录:命中规则、AI分、候选通道数、降级原因 |