AI 智能支付路由系统 — 使用说明

版本：v3.0 · 更新时间：2026-05-27
适用对象：商户、运营、产品团队
系统状态：内测中

一、这套系统是做什么的？

每笔支付订单发起时，系统需要在多条支付通道中选出一条来处理。传统做法是人工配置固定规则——"按权重轮流用"或"哪个好用用哪个"——无法感知通道实时状态，往往通道已经出问题了才发现。

AI 智能路由的核心价值是：

实时感知：持续监控每条通道的成功率、响应速度、稳定性趋势，每 60 秒自动刷新一次 AI 评分

智能决策：每笔订单支付前，在毫秒级（≤10ms）选出当前综合表现最优的通道

自动保护：通道质量异常时自动熔断隔离，恢复后通过"半开试探"机制安全回归

持续学习：Python 机器学习模型 + Java 规则公式双引擎评分，权重每小时自动优化

风控联动：与 AI 风控系统深度联动，提前感知 AT 渠道侧风险并自动隔离，风险解除后自动恢复

相关页面可视化截图如下（基于测试数据演示）：

最终效果是：商户无感知，支付成功率持续提升，异常通道自动规避。

二、整体决策流程

每笔订单的路由决策分两个阶段串行执行：

订单进来
    │
    ▼
┌─────────────────────────────────────┐
│  第一阶段：规则引擎                  │
│  按业务规则过滤明显不合适的通道       │
│  结果：得到一个"候选通道池"           │
└────────────────┬────────────────────┘
                 │
                 ▼
┌─────────────────────────────────────┐
│  第二阶段：AI 决策引擎               │
│  对候选通道池进行 AI 评分和融合打分   │
│  结果：选出当前最优通道              │
└────────────────┬────────────────────┘
                 │
                 ▼
            返回最优通道，发起支付

两个阶段各司其职：规则引擎负责"排除不行的"，AI 引擎负责"从剩下的里选最好的"。

三、规则引擎详解

3.1 规则引擎的作用

规则引擎是第一道过滤关，用于解决明确的业务约束，例如：

这笔订单是微信支付，某条通道不支持微信，直接排除

这条通道最近 5 分钟成功率只有 30%，明显在抖动，排除

大额订单（≥5000 元）必须走指定的高质量专属通道

夜间时段某些通道表现历史性偏差，夜间自动绕开

根据 AI 模型判定某通道可能触碰 AT 渠道风险阈值，自动排除

规则引擎的优点是可配置、可即时生效、逻辑透明，运营人员可以随时添加、修改、禁用规则，无需发版。

3.2 规则类型与执行顺序

系统内置两种规则类型，按优先级串行执行：

① 平台全局规则（对所有商户生效）优先执行
   ↓
② 商户专属规则（仅对指定商户生效）后执行
   ↓
③ 同类规则内按优先级从高到低执行
   ↓
④ 前一条规则已过滤的通道，不会被后续规则重复处理

3.3 规则构成：条件 + 逻辑 + 动作

每条规则由三部分组成：

条件：检查通道指标或订单维度是否满足阈值
逻辑：多个条件之间是 AND（全部满足）还是 OR（任一满足）
动作：满足条件时对通道做什么处理

条件逻辑

逻辑类型	说明	典型场景
`AND` 全部满足	所有条件都成立，规则才触发	"成功率低且响应慢"才过滤，避免误伤
`OR` 任一满足	任意一个条件成立，规则即触发	"成功率低或 AI 分低"就过滤，更严格

3.4 规则动作（3 种）

动作	说明	典型使用场景
过滤（exclude）	将命中条件的通道从候选池移除	成功率过低、不支持该支付方式
白名单路由（include_only）	只允许指定通道参与决策，其余全部排除	大额订单走专属 VIP 通道
轮询切换（rotation）	按金额或失败次数阈值在通道间轮流切换	平衡多通道流量分配、规避单通道限额

3.5 可配置的条件字段

规则条件支持 14+ 个字段，覆盖通道实时指标、AI 评分、通道属性、订单维度四个维度：

实时成功率（7 个时间窗口）

这是规则引擎最核心的条件字段，反映通道在不同时间窗口内的历史支付成功率：

字段	时间窗口	数据来源	推荐场景
`success_rate_1m`	近 1 分钟	Redis 实时滑动窗口	紧急异常快速响应，敏感度最高
`success_rate_5m`	近 5 分钟	Redis 实时滑动窗口	日常首选，兼顾实时性与稳定性
`success_rate_10m`	近 10 分钟	Redis 实时滑动窗口	中等敏感度规则
`success_rate_30m`	近 30 分钟	Redis 实时滑动窗口	持续性低成功率检测
`success_rate_1h`	近 1 小时	数据库聚合统计	综合评估，AI 评分的核心输入
`success_rate_6h`	近 6 小时	数据库聚合统计	夜间等周期性规则
`success_rate_24h`	近 24 小时	数据库聚合统计	长期稳定性基准

成功率值范围 0~1，支持百分比写法，"80%" 与 "0.8" 等效。

AI 综合评分

字段	说明
`ai_score`	AI 综合评分（0~100 分），由 AI 引擎每 60 秒计算一次

通道自身属性

字段	说明
`channel_status`	通道状态：`1`=启用，`0`=停用
`weight`	商户对该通道设置的权重（1~100）
`pay_way_code`	通道支持的支付方式列表

订单维度

字段	说明
`order_amount`	本笔订单金额（单位：元）
`order_hour`	当前小时（0~23），支持跨零点时间段

3.6 规则时间窗口控制

每条规则可配置生效时间范围，支持精确到时段和日期类型：

配置项	说明	示例
`startTime` / `endTime`	生效时段，支持跨零点	`"21:00"` ~ `"08:00"`
`dateType`	生效日期类型	`weekdays`（工作日）、`weekends`（周末）、`daily`（每天）
`timezone`	时区	`"Asia/Shanghai"`

示例：夜间加强规则（21:00 ~ 次日 08:00，仅工作日生效）

{
  "startTime": "21:00",
  "endTime": "08:00",
  "dateType": "weekdays",
  "timezone": "Asia/Shanghai"
}

3.7 轮询功能详解

轮询是系统在多通道间智能切换流量的核心能力，支持三种轮询类型：

轮询类型	触发条件	适用场景
金额轮询（amount）	单笔订单金额 ≥ 配置的阈值时切换	避免单通道承载过大金额，规避限额和风控
失败轮询（fail）	累计失败次数 ≥ 配置的阈值时切换	通道质量不稳定时自动绕行
混合轮询（both）	满足金额或失败条件任一即切换	综合保护

轮询配置字段说明：

字段	说明	示例
`type`	轮询类型	`"amount"` / `"fail"` / `"both"`
`threshold`	金额阈值（单位：元，金额轮询时使用）	`300` 表示单笔订单 ≥ 300 元时切换
`failThreshold`	失败次数阈值（失败轮询时使用）	`10` 表示累计失败 10 次时切换
`direction`	轮询方向	`"asc"`（正向轮询）/ `"desc"`（逆向轮询）
`cooldownSeconds`	冷却时间（秒，仅失败/混合轮询生效）	`60` 表示切换后 60 秒内不再切换

金额轮询特别说明：

金额轮询不受冷却时间影响，每笔达到阈值的订单都会切换到下一个通道

冷却时间主要用于失败次数轮询，防止并发场景下频繁切换

轮询示例：

配置：
  轮询类型：金额轮询
  金额阈值：300 元
  轮询方向：正向（asc）

效果：
  订单 ¥368 → 通道 A
  订单 ¥838 → 通道 B
  订单 ¥999 → 通道 C
  订单 ¥533 → 通道 D
  订单 ¥757 → 通道 A（循环回来）
  ... 依次轮询

3.8 规则配置示例

示例 1：近 5 分钟成功率低于 80%，自动过滤该通道

条件：success_rate_5m < 80%
逻辑：AND
动作：过滤
说明：5 分钟内成功率低于 80% 说明通道正在抖动，直接移出候选池

示例 2：大额订单（≥5000 元）强制走 VIP 专属通道

条件：order_amount ≥ 5000
逻辑：AND
动作：白名单路由 → 指定 VIP 通道 A、VIP 通道 B
说明：大额资金对稳定性要求更高，强制走高质量专属通道

示例 3：夜间（22:00-次日 06:00）AI 评分低于 50 分的通道过滤

条件：ai_score < 50
时间：22:00 ~ 06:00，每天生效
动作：过滤
说明：夜间运营人员值守少，加强过滤条件，减少人工干预需求

示例 4：按单笔订单金额轮询切换通道（超 300 元换下一个）

条件：（无条件，持续生效）
动作：轮询切换
轮询类型：单笔订单金额超过 300 元时切换到下一条通道
轮询方向：正向轮询
冷却时间：60 秒（金额轮询不受冷却影响）
说明：避免单通道承载过多金额，规避限额和风控

四、AI 决策引擎详解

4.1 AI 引擎的作用

规则引擎过滤后，剩余的候选通道都是"符合基本条件的"，但质量仍有高低之分。AI 决策引擎的任务是：在候选通道里，选出当前综合表现最优的那一条。

AI 引擎不依赖人工配置规则，而是从历史支付数据中自动学习，识别每条通道的真实能力。

4.2 双引擎评分架构

系统采用 Python 机器学习模型 + Java 规则公式 双引擎架构：

                    ┌─────────────────────┐
                    │  ChannelScoreJob    │
                    │  每 60 秒执行一次     │
                    └──────────┬──────────┘
                               │
                    ┌──────────▼──────────┐
                    │   ScoreCalcEngine   │
                    │                     │
                    │  ┌───────────────┐  │
                    │  │ Python ML 模型│  ← 优先：批量推理，精准评分
                    │  └───────┬───────┘  │
                    │          │ 不可用时 │
                    │  ┌───────▼───────┐  │
                    │  │ Java 规则公式 │  ← 降级：多窗口加权计算
                    │  └───────────────┘  │
                    └─────────────────────┘

Python ML 模型：基于 scikit-learn 训练，利用多维特征进行非线性推理评分

Java 规则公式：多窗口加权 + 趋势分析 + 惩罚项，确保 ML 不可用时仍有可靠评分

权重自动训练：ModelWeightTrainer 每小时执行梯度下降，动态优化各维度权重

4.3 AI 评分模型：四维评分

每条通道都有一个 0~100 分的 AI 综合评分，由四个维度加权计算：

AI 评分 =
    成功率得分    × 50%    ← 最重要：通道的支付成功率
  + 响应速度得分  × 25%   ← 付款有多快
  + 稳定性趋势得分 × 15%  ← 近期是在变好还是变差
  + 近期活跃度得分 × 10%  ← 是否有足够的样本支撑评估
  - 连续失败惩罚（最高扣 15 分）
  - P95 高延迟惩罚（最高扣 10 分）
  - 风控系统推送惩罚（最高扣 80 分）

权重含义说明：

成功率占比最高（50%），因为支付的首要目标是"成功"；响应速度次之（25%），影响用户体验；稳定性趋势（15%）识别通道是否在恶化；活跃度（10%）保证评分有足够样本支撑。

4.4 各维度评分算法

维度一：成功率得分

不是单纯用一个时间窗口，而是三个窗口加权，近期数据权重更高，避免历史残留数据遮盖当前真实状态：

时间窗口	权重	说明
近 1 小时	50%	近期表现，权重最高
近 6 小时	25%	中期趋势
近 24 小时	15%	长期稳定性
兜底基准值	10%	无数据时的保守估计

同时有低样本保护：当近 1 小时内订单数不足 5 笔时，该窗口权重自动从 50% 降至 25%，避免"1 笔失败 → 成功率 0% → 评分崩溃"的误判。

维度二：响应速度得分

折线插值，越快分越高：

平均响应时间	得分
0 ~ 300ms	100 分（优秀）
300 ~ 800ms	85 ~ 100 分
800 ~ 1500ms	70 ~ 85 分
1500 ~ 3000ms	45 ~ 70 分
3000 ~ 5000ms	20 ~ 45 分
> 5000ms	0 分（不可接受）

维度三：稳定性趋势得分

识别通道是在变好还是在变差：

近 1 小时成功率 ≥ 近 24 小时成功率 → 100 分（趋势向好）
近 1 小时成功率 < 近 24 小时成功率 → 按差值线性扣分，最低保底 20 分（趋势恶化）

这个维度能识别出"表面上平均成功率还行，但实际上正在走下坡路"的通道，提前降低其优先级。

维度四：近期活跃度得分

样本越多，评分越可信：

近 1 小时订单数 ≥ 5 笔 → 按对数曲线计算活跃度得分（0~100）
近 1 小时订单数 < 5 笔 → 固定 50 分（中等水平，不惩罚新通道）

额外惩罚项

连续失败惩罚：近 1 小时失败笔数超过 20 笔后，每多失败 1 笔扣 0.5 分，上限扣 15 分

P95 高延迟惩罚：P95 响应时间超过 3000ms 后，超出越多扣分越多，上限扣 10 分

风控系统推送惩罚：与风控系统联动，当风控系统推送可能存在 AT 渠道风险的通道时进行预警，返回惩罚评分，最高扣 80 分

4.5 最终融合评分

AI 评分只是输入之一，最终决策依据是融合了多个维度的综合分：

最终融合评分 =
    AI 评分      × 60%   ← 核心，反映通道实时质量
  + 通道权重得分  × 20%  ← 商户对各通道的偏好配置
  + 费率得分     × 10%  ← 费率越低得分越高（成本优化）
  + 随机扰动     × 10%  ← 防止流量完全集中到同一通道

随机扰动的必要性：如果没有扰动，所有流量会持续打到当前最高分通道，导致其他通道因无流量而无法积累数据，形成"马太效应"。适当的随机扰动让每条通道都能持续获得流量和反馈，保持评分的有效性。

4.6 特殊决策策略

大额订单保护

订单金额 ≥ 5000 元时，系统自动收紧决策：

随机扰动从 10% 缩小至 2%（大额资金不能赌运气）

AI 评分权重从 60% 提升至 68%（更依赖数据，减少随机性）

决策日志中标注 大额保护 模式

冷启动均匀分流

新上线的通道没有历史数据，无法计算评分。系统为其分配默认 60 分（中等水平），并启用 Round-Robin 均匀轮询：在所有无历史数据的新通道之间轮流分配流量，快速积累真实数据，让 AI 尽早接管决策。

降级兜底保障

无论规则过滤得多严格，系统保证永远返回一个可用通道：

正常情况     → AI 决策最优通道
所有通道被过滤 → 从未熔断通道中随机兜底（标注降级标志）
所有通道熔断  → 从全部通道中随机兜底（标注降级标志）

重试换通道

当调用方发起重试请求（isRetry=true）时，系统自动跳过上次失败的通道，优先选取次优通道，避免重复踩坑。

AI 低分软惩罚

AI 评分低于 30 分的通道不会被硬过滤，而是按比例降权（最低降至原权重的 30%），保留一定概率，避免因短期评分过低而完全失去流量。

4.7 权重自动训练

AI 四维权重不是固定写死的，系统每小时自动执行一次梯度下降训练：

收集近 1 小时全部路由结果数据
    ↓
计算当前权重下的预测误差（实际成功率 vs 目标 95%）
    ↓
沿误差梯度方向微调四维权重
    ↓
归一化确保四维之和 = 1.0，写入 Redis 并持久化历史
    ↓
下一轮评分计算使用新权重

保护机制：每个维度的权重范围约束在 [0.05, 0.80]，防止某一维度过度主导导致评分失衡。训练样本不足 100 笔时自动跳过本轮训练，避免小样本带来噪声。

五、熔断保护机制

熔断是对通道质量的自动兜底保护，独立于规则引擎和 AI 引擎运行。

5.1 自动触发条件

满足以下任意一条即触发熔断，该通道从所有商户的路由候选池中移除：

触发条件	默认阈值	说明
近 5 分钟成功率过低	< 30%（且样本 ≥ 10 笔）	通道正在大量失败

系统每 60 秒由 ChannelScoreJob 自动检测所有通道，发现异常立即熔断。

5.2 熔断时长指数退避

同一通道频繁熔断时，每次熔断时长自动翻倍，防止反复"熔断 - 恢复 - 熔断"抖动：

24 小时内第几次熔断	熔断时长
第 1 次	10 分钟
第 2 次	20 分钟
第 3 次	40 分钟
第 4 次及以上	2 小时（上限）

熔断次数统计在 24 小时后自动重置，避免历史问题永久影响通道。

5.3 半开自动恢复

熔断到期后，不是直接恢复，而是先进入半开状态进行试探：

熔断到期
    ↓
进入半开状态，接入少量真实流量试探
    ├── 连续 3 笔支付成功 → 完全恢复，重新纳入正常路由
    └── 任意 1 笔支付失败 → 立即重新熔断（熔断次数继续累加）

半开状态最长保护 30 分钟。若半开期间 2 小时内无任何失败记录，系统也会自动恢复通道。

这样设计可以避免"通道刚恢复就立刻承接大量流量，结果又挂掉"的情况。

六、数据闭环：AI 如何持续学习

① 每笔订单路由到某通道，发起支付
       ↓
② 支付完成后，结果（成功/失败/超时关单）回写给系统
       ↓
③ 成功/失败结果进入 Redis 实时滑动窗口，立即影响成功率指标
       ↓
④ 每 60 秒，ChannelScoreJob 重新计算所有通道评分
       ↓
⑤ 优先使用 Python ML 模型批量推理；不可用时自动降级为 Java 规则公式
       ↓
⑥ 每小时，梯度下降训练优化四维权重
       ↓
⑦ 下一笔订单路由时，使用最新评分做决策

特别说明：超时关单不污染 AI 数据

扫码支付等场景下，用户扫码后可能长时间未确认付款，系统超时主动关单。这是用户行为，与通道质量无关。系统专门区分了这类状态，超时关单只记录日志，不计入通道的成功或失败统计，不影响 AI 评分，避免因用户行为导致好通道被误降级。

七、核心指标与预期效果

指标	说明
路由决策延迟	每笔订单路由耗时 ≤ 10ms（目标），对支付链路无感知
评分刷新频率	每 60 秒全量刷新所有通道评分
实时成功率感知	最短 1 分钟内感知通道质量变化（Redis 滑动窗口）
熔断响应时间	5 分钟内自动识别并隔离异常通道
权重优化周期	每 1 小时自动完成一轮梯度下降训练
决策可追溯性	每笔路由决策全量记录：命中规则、AI 分、候选通道数、降级原因

八、兜底策略

当系统误判某个应用通道可能存在异常，导致该通道被 AI 决策影响而不可用时，可在后台一键重置该通道的总体评分。 重置后，该通道等同于新上线的通道，以默认中等评分重新参与路由决策，快速恢复流量分配。

文档版本 v3.0 · 如有问题请联系后端开发团队

AI智能路由指引-内测

AI 智能支付路由系统 — 使用说明#

一、这套系统是做什么的？#

最终效果是：商户无感知，支付成功率持续提升，异常通道自动规避。#

二、整体决策流程#

三、规则引擎详解#

3.1 规则引擎的作用#

3.2 规则类型与执行顺序#

3.3 规则构成：条件 + 逻辑 + 动作#

3.4 规则动作（3 种）#

3.5 可配置的条件字段#

实时成功率（7 个时间窗口）#

AI 综合评分#

通道自身属性#

订单维度#

3.6 规则时间窗口控制#

3.7 轮询功能详解#

3.8 规则配置示例#

四、AI 决策引擎详解#

4.1 AI 引擎的作用#

4.2 双引擎评分架构#

4.3 AI 评分模型：四维评分#

4.4 各维度评分算法#

维度一：成功率得分#

维度二：响应速度得分#

维度三：稳定性趋势得分#

维度四：近期活跃度得分#

额外惩罚项#

4.5 最终融合评分#

4.6 特殊决策策略#

大额订单保护#

冷启动均匀分流#

降级兜底保障#

重试换通道#

AI 低分软惩罚#

4.7 权重自动训练#

五、熔断保护机制#

5.1 自动触发条件#

5.2 熔断时长指数退避#

5.3 半开自动恢复#

六、数据闭环：AI 如何持续学习#

七、核心指标与预期效果#

八、兜底策略#