近 24h 一个反常信号:订单量涨了(1185 → 1508,+27%),但完成率反而从 25.2% 掉到 18.8%,失败订单几乎翻倍(150 → 389)。表面像是「量大了质量下降」,但拆开后是另一个故事。
先排除两个常见误判:
真正的根因:这些「没取到号」的失败里,近 69% 落在 7 天成功率 < 2% 的组合上,加上 2–10% 的"弱组合"共占 88%——也就是说,绝大多数失败不是"好产品临时缺货",而是用户被允许下单(并反复重试)我们结构上就供不出的组合。真正健康产品的临时缺货只占 1.8%。
| 近 24h 失败按「组合健康度」分类 | 组合数 | 失败数 | 占失败比 |
|---|---|---|---|
| 死路 (<2% 7d 成功率) | 70 | 266 | 68.7% |
| 弱 (2–10%) | 8 | 74 | 19.1% |
| 中等 (10–25%) | 10 | 40 | 10.3% |
| 健康 (≥25%,真·临时缺货) | 3 | 7 | 1.8% |
把窗口拉到 30 天,死路组合的下单占比每一天都在 16%–36% 之间——从来没消失过。近几天(06-30、07-01)冲到 36%。这不是一次抖动,而是一个长期存在、约占 1/4 订单量的结构性漏损,只是因为不扣费而从没进过任何看板。
| 日期 | 总订单 | 死路订单 | 死路占比 | 整体失败率 |
|---|---|---|---|---|
| 2026-07-03 | 1,429 | 436 | 30.5% | 26.6% |
| 2026-07-02 | 1,244 | 293 | 23.6% | 12.6% |
| 2026-07-01 | 1,643 | 597 | 36.3% | 29.0% |
| 2026-06-30 | 1,396 | 506 | 36.2% | 29.2% |
| 2026-06-29 | 1,215 | 337 | 27.7% | 17.7% |
| 2026-06-25 | 1,506 | 391 | 26.0% | 20.1% |
| 2026-06-15 | 1,484 | 333 | 22.4% | 18.3% |
| 2026-06-05 | 1,893 | 306 | 16.2% | 7.3% |
(表为节选;30 天内每天死路占比均在 16–36% 区间。可见失败率与死路占比高度同步——死路组合就是失败率的主要推手。)
把 7 天的死路下单按「有多少不同用户在要」拆开,得到两个截然不同的问题:
| 类型 | 组合数 | 7d 下单 | 成功 | 涉及用户次 | 信号 |
|---|---|---|---|---|---|
| 广泛真实需求(≥15 用户/组合) | 11 | 655 | 3 | 357 | 采购 / 选品信号 |
| 集中重试(<15 用户/组合) | 475 | 2,100 | 4 | 852 | 选品洁净 / 防刷 |
这些是很多不同用户反复在要、我们却几乎永远给不出的组合。openai/CA 是最扎眼的:136 笔下单、83 个不同用户,只成功 2 笔。这是明确的、可变现的需求,我们要么把货组出来,要么至少别再让它出现在选项里误导用户。
| 组合 | 7d 下单 | 成功 | 成功率 | 不同用户 | 性质 |
|---|---|---|---|---|---|
| openai/CA | 136 | 2 | 1.5% | 83 | 广泛需求 |
| telegram/OM | 87 | 0 | 0% | 52 | 广泛需求 |
| telegram/NI | 54 | 0 | 0% | 37 | 广泛需求 |
| telegram/CN | 89 | 0 | 0% | 32 | 中文服务 |
| telegram/TW | 66 | 0 | 0% | 28 | 广泛需求 |
| google/CA | 34 | 0 | 0% | 28 | 广泛需求 |
| telegram/KR | 63 | 0 | 0% | 25 | 广泛需求 |
| openai/SG | 51 | 1 | 2.0% | 20 | 广泛需求 |
🀄 中文系服务(redbook-xiaohongshu/CN 217 笔、telegram/CN、tiktok/CN、alipay/CN、weibo/CN)成功率清一色 0%——与既往观察一致:中文流量把想要亚洲/中国号码的用户引进来,但我们没有对应货源。要么停止对这些用户展示,要么补货。
长尾里大量是"某几个用户各试几次、几乎全灭"的小众组合。极端个案:一个用户 3 天内为 wolt/RS 下了 62 单、45 单失败;另一个用户为 telegram/KZ 单独下了 44 单失败。系统目前只有"最多 2 个并发订单"的限制(MaxConcurrentOrders=2),没有任何"同一死路组合的重试冷却"——用户可以每几秒就把同一个必败组合再点一遍,每次都触发一整轮供应商 fallback 空烧。
后端代码确认:下单链路上完全没有"可用性 / 库存"检查。
service/order/service.go:391-530 只校验 catalog 是否有可售 offer + 价格,从不调用 GetAvailableCount()。GetAvailableCount() 在 supplier 接口里存在但从未在下单时被调用(supplier/interface.go:17)。comboHealthRepo(组合健康度)只在fallback 候选过滤时用(service/supplier/service.go:418),下单入口不查它——所以任何有 catalog offer 的组合都能下单,无视近期是否 100% NO_NUMBERS。5sim.net 对 redbook/CN 返 INVALID_COUNTRY 216 次、对 telegram/CN 88 次——我们把订单路由给了根本不支持该地区的供应商。这是纯配置/路由问题,不是缺货。好消息:修复所需的两块能力(GetAvailableCount + comboHealthRepo)都已经写好了,只是没接到下单入口。这让 P1 修复的工程量和风险都很低。
要强调的是——这不是收入起火。当前各项收入指标都在正常区间:
正因为收入看板一切正常,这个问题才更值得点出来:你的看板看起来没事,但每 4 个尝试下单的用户里就有 1 个撞上一堵你看不见的墙——这是增长天花板和留存的慢性失血,不是当期收入的波动。
对近期结构性 ~0 成功率的组合,在下单时直接返回"暂时不可用",而不是让用户等 30–90 秒 fallback 后收到"失败"。复用已存在的 GetAvailableCount() / comboHealthRepo,加 config 开关 + 灰度。预期:每天省下 ~940 次供应商调用、修复每周约 1,200 次用户撞墙、把可见失败率打回 ~13%。阈值需 A/B(遵循我们对"选品可见性/推荐权重变更须 A/B、不自动上线"的既有红线,故本次不自动提 PR)。
openai/CA(83 用户)是首选机会,其次 telegram/OM(52)、telegram/NI(37)、google/CA(28)。每个组合二选一:能组出货源就补货变现;短期供不出就从展示里移除,别让用户空跑。中文系服务(redbook/CN 等)同理决策。
5sim/durianrcs 对特定组合确定性返 INVALID_COUNTRY——从 execution_routes 里剔除这些必败路由,停止空烧。durianrcs 933 / sms-bus 50214 等裸数字错误码目前直接透传(strconv.Itoa)。需拿到供应商 API 文档确认语义后再映射——不可臆测,映射错会改动 fallback 行为。方法论 & 可复现性:所有数字取自 production 只读库(orders / supplier_execution_attempts / topups)+ GA4 Data API(property 512790783)+ main 分支后端代码交叉验证。"死路组合"定义:7 天完成率 < 2%。窗口截至 2026-07-03 20:08 UTC。所有查询均为只读聚合,未做任何写操作。
自动生成 · DogeSMS 经营日报 · 2026-07-04