DogeSMS · 经营情报日报

我们建好的「接码率自愈」防护,从未在生产开启 —— 死库存正在烧掉用户

数据窗口:截至 2026-06-30 20:00 UTC(过去 24h / 7d / 30d 对比)· 来源:production 只读库 + 源码 main 分支 + GA4 (property 512790783)
一句话情报:加拿大 (CA) 号码在所有主力服务上的端到端完成率只有 5.6%(其它国家 26.0%),过去 7 天烧掉 951 单 / 322 个用户,其中 83 个新用户「人生第一单」就用 CA 失败。本该自动下架这类死库存的「接码率自愈」worker(combo_health)在生产里 enabled=false,从未开启,决策表为空。更要命的是:就算现在打开它也几乎没用 —— 当前流量下 404 个供应商组合里只有 2 个能越过它「100 样本/24h」的评估门槛,1% 的下架阈值也太松。GA4 显示 CA 根本不在流量 top-12(流量被中国 3923 / 美国 2069 / 日本 1026 占据),说明 CA 订单不是真实需求,而是 catalog 摆出来的「陷阱库存」。
5.6%
CA 完成率(7d)
其它国家 26.0%
951
CA 订单(7d)
#2 大订单国
322
被波及用户
≈ 全部活跃用户 19%
83/88
新用户首单 CA 失败
仅 5 成功
OFF
combo_health.enabled
生产从未开启
2/404
能被自愈器评估的组合
99.5% 够不到样本门
0
历史自动下架组合数
决策表为空
~22%
整体完成率(vs 6 月初 ~32%)
mix-shift 拖累

1 · 现象:完成率与营收同步下滑,但分服务接码率是稳的

过去一个月订单量从 6 月初 2000–2800/日 滑到现在 1000–1500/日,端到端完成率(completed/总单)从 ~32% 跌到 ~22%,营收同步从 ~$1,000–1,500/日 降到 ~$500/日。这与已知的「单篇拳头博文 organic 流量下滑」一致——属于流量端问题。

但完成率的下滑主要是 mix-shift(结构性假象),不是供应链变差:按服务拆周环比,主力 openai 接码稳定甚至微升(46.1% → 48.0%),下滑全部集中在本就低接码的服务放量:

服务上周单量上周完成率本周单量本周完成率判读
openai259246.1%258748.0%稳,健康
telegram24594.8%20976.3%大盘低接码
whatsapp6468.2%12084.6%放量翻倍 + 接码腰斩
google40012.0%67112.8%
codebuddy6046.7%30319.5%放量 5x + 接码崩(仅 4 用户,疑 API 刷)
SQL: orders 按 service_code 周环比,created_at ∈ [now-14d, now],HAVING n>300

2 · 根因:CA 号码在所有服务、所有供应商上都收不到码

把订单按国家拆开,CA(加拿大)是一个跨服务的系统性黑洞——它在每一个主力服务上都几乎收不到码:

服务/国家单量(7d)完成率取消过期(到点无码)取号失败
whatsapp/CA4094.4%2411446
telegram/CA3297.0%1751310
openai/CA1071.9%432933
google/CA490.0%4270

对比之下 openai/US 完成率 58.7%。这不是某一家供应商的问题——把 CA 订单按供应商拆,每一家都很差,说明是 CA 号码本身(号段/落地能力)无法承接这些 OTP:

供应商(CA, 7d)单量完成率性质
durianrcs.com35510.4%第三方聚合
grizzlysms.com2330.9%第三方聚合
sms-bus.com1965.6%第三方聚合
5sim.net1152.6%第三方聚合
isptelecom520.0%自营号池
新用户首单杀手:本周 88 个新用户的「人生第一单」就是 CA 号,只有 5 单成功(5.7%)。83 个新用户在第一次尝试就吃了闭门羹 —— 这是最贵的一类流失:获客成本已付,LTV 直接归零。
SQL: orders WHERE country_code='CA',按 service_code / supplier_slug 分组;新用户 = MIN(created_at) ∈ 7d 且首单 country='CA'

GA4 交叉验证:CA 不是真实需求,是「陷阱库存」

过去 7 天 GA4 活跃用户分布:中国 3923、美国 2069、日本 1026、香港 687、新加坡 546、台湾 292、俄罗斯 146……加拿大根本进不了 top-12。但 CA 却是第 2 大订单国(951 单)。结论:CA 订单并非加拿大访客的真实需求,而是用户在国家选择器里看到 CA「有货、价格中等」就点了,然后必然失败。Catalog 把一个收不到码的国家摆在货架上卖。

GA4 property 512790783 · dimension=country, metric=activeUsers, 7daysAgo→today

3 · 为什么没被拦住:自愈防护被关着,且开了也基本空转

承接 6-28 情报:「死组合 / 无效需求」这个主题,6-28 的日报已经发现并落地了一条报告层告警(evalWastedDemand,每日在 A 卡暴露高需求低履约的组合)。本条不重复那个结论,而是补三个它没覆盖的角度:① CA 是最大的单一死库存桶且是跨服务的「地理」失败(非单供应商);② GA4 证明 CA 不是真实需求;③ worker 层的空转盲点(报告告警管不到「combo_health 开了却空转」)—— 见下方配套 PR。

代码里其实有一套设计完整的「P2 接码率自愈」机制(combohealth service + worker + admin UI + 大量 review 修复),逻辑是:某 (供应商,服务,国家) 三元组 24h 接码率 < 1% 且样本 ≥ 100 → 自动下架(hidden)。但它有两层失效:

失效一 · 生产从未开启。 config.production.yamlcombo_health.enabled: false(注释「灰度上线开关,默认关」)。cmd/worker/main.go:789if cfg.ComboHealth.Enabled 把整个 worker 门住——生产日志是「combo health worker disabled by config」。combo_health_decisions0 行,印证它从没跑过。
失效二 · 就算开了也几乎评估不了任何组合。 它的样本门是「单个 (供应商,服务,国家) 三元组 24h 内 ≥ 100 次 attempts」。但当前流量太分散:过去 24h 共 404 个活跃三元组、2359 次 attempts,平均每个三元组才 5.8 次/天——只有 2 个三元组够得到 100 的门槛,且这 2 个接码率都 > 1%(不该下架)。结果:自愈器即使开启,每轮也只能评估 0.5% 的组合,对 CA 这种分散在 4-5 家供应商上的死库存完全无感。

样本门 vs 真实流量(越细的粒度越够不到门槛)

评估粒度 / 窗口组合总数能达 100 样本占比
(供应商,服务,国家) · 24h(现状)40420.5%
(服务,国家) 跨供应商池化 · 24h19731.5%
(供应商,服务,国家) · 7d1252191.5%
(服务,国家) 跨供应商池化 · 7d624284.5%

即便放宽到 7d + 池化,覆盖率也只有 4.5%。说明 min_sample_size=100 是按一个不存在的流量规模标定的,本质是参数与现实错配。

顺带:一整条 0% 长尾仍在售

除了 CA,还有一批接码率≈0 的组合在正常售卖:telegram/OM·SG·CN·KR·TWwhatsapp/QA·EC·PEopenai/SG(50 单 @ $1.02/单,0% 完成)。其中部分 telegram 免费组合($0)疑似 bot 探测,但付费的(如 openai/SG)是真金白银的差体验。

SQL: supplier_execution_attempts 24h/7d,按粒度 GROUP BY,COUNT(*)≥gate;combo_health_decisions 全表 0 行

4 · 建议动作(按性价比排序)

1
立即手动下架死库存(运营,0 代码,今天可做)。在 catalog 把 CA 对 whatsapp/telegram/openai/google 的售卖关掉或重度降权,同时清掉 0% 长尾(openai/SG 等)。预计每周止损 ~900 次失败订单、保护 ~320 用户、尤其救回 ~80 个新用户首单体验。
2
开启 combo_health(需先重标定,否则等于没开)。enabled 置 true 前,至少调整:① min_sample_size 100 → 20–30,匹配真实流量;② 把评估粒度从 (供应商,服务,国家) 升到 (服务,国家) 跨供应商池化(用户只在意服务+国家能不能收码);③ hide_threshold 1% → 视情况升向 3–5%(1% 太松,5% 完成率仍是糟糕体验)。这是有营收影响的决策,建议 3 人小队碰一下再灰度。
3
本次已配套提交:自愈器空转可观测性(见下方 PR)。给 worker 加 assessable 计数 + 「评估了组合但一个都没越过样本门」时打 WARN。这样一旦开启 combo_health,运营能立刻看出它是真在防护、还是 enabled=true 的空转——避免「以为开了防护,死库存照卖」的隐性失效再次发生。纯加日志/指标,不改任何 hide/unhide 行为,零营收风险,可随时回退
为什么这次只提交可观测性、不直接帮你们打开/重标定?开启或重标定一个会「自动下架在售库存」的防护,属于直接影响营收且不易逆转的动作,在无人值守的自动跑批里盲改不负责任——这类决策留给你们 3 人。本 PR 是配套的「安全前置」:让第 2 步真正打开它时有仪表盘兜底。