阿里云企业账号出售 阿里云国际版风控案例分享
话说去年夏天,我在新加坡一家做快消品的电商平台做技术顾问,老板把我拉进会议室时,桌上摆着三杯冰美式,还有一张打印歪了的KPI表——上面‘用户投诉率’那栏,红得像刚被泼了番茄酱。
他们用的是阿里云国际版(Alibaba Cloud International),不是国内那个熟悉的‘阿里云’,而是另一套独立部署、合规适配GDPR、PDPA、甚至菲律宾《数据隐私法》的云环境。听起来很酷?是挺酷,直到你发现它的WAF日志里每天躺着27万条‘疑似撞库’请求,而真正下单的用户,有1/4在支付前被弹窗拦住,提示‘系统检测到异常行为’——然后默默关掉页面,去隔壁Shopee下单了。
这哪是风控?这是‘风杀’。
第一刀:先别急着上AI,先把‘假阳性’当仇人
我们没碰模型,先翻日志。连续盯了三天,发现一个诡异现象:凌晨2:17–2:23之间,总有约3800个账号集中登录,IP分散在印尼、越南、菲律宾三个国家,但User-Agent全是同一款国产安卓模拟器的旧版本。更绝的是,这些账号全在3分钟内完成‘登录→浏览3个商品→加购→放弃支付’的标准流水线动作——像极了被写死脚本控制的木偶。
但当时风控策略是‘单IP 5分钟内登录失败≥3次,封30分钟’。问题来了:这3800个请求,来自127个不同IP,每个IP只试了2次就换号。规则形同虚设。
于是我们干了件看起来很土的事:在阿里云国际版的Function Compute里写了个轻量级‘行为指纹生成器’,不看IP,不看设备ID(很多安卓机根本没稳定ID),而是抓三样东西:
① 页面JS加载耗时分布(模拟器通常比真机慢120–180ms);
② 鼠标移动轨迹熵值(真人滑动有抖动、停顿、回溯,脚本是直线+匀速);
③ localStorage里某个特定键的读写时序(真机有预加载,模拟器是边读边卡)。
把这些拼成一个16位字符串,哈希后存在Redis Cluster(阿里云国际版的ApsaraDB for Redis)里。同一指纹,3小时内出现≥5次?直接打标‘可疑集群’,后续请求走增强验证流。上线一周,撞库登录失败率降了57%,关键是——真实用户零感知。没人被多输一次验证码。
第二刀:规则引擎不是摆设,是能呼吸的活体
很多人以为阿里云国际版的Web Application Firewall只能配黑白名单。错。它内置的Custom Rule Engine支持Lua脚本热更新,且毫秒级生效。我们把它当成了‘策略中枢神经’。
举个例子:有个促销活动,限时1元抢卫生巾。黑产立刻嗅到钱味,用代理池疯狂刷库存。原策略是‘单账号1小时限购2件’,结果他们注册了11.7万个马甲号……
我们没加新模型,只写了段32行Lua:
if geoip.country_code == 'ID'
and http_user_agent:match('Dolphin')
and ngx.var.arg_promo_id == 'sanitary_2024'
then
local key = 'promo:'..ngx.var.remote_addr..':hash'
local count = redis:incr(key)
if count > 3 then
ngx.exit(429)
end
redis:expire(key, 300)
end
意思很直白:印尼来的、User-Agent带Dolphin(某国产模拟器)、抢卫生巾活动的请求,按IP限频5次/5分钟。注意,这里没用账号维度,因为账号可伪造;也没用设备ID,因为根本拿不到;就用最糙但最稳的IP+行为特征组合。上线当天,刷单请求暴跌91%,而印尼真实用户下单量反升14%——他们终于不用跟机器人抢了。
第三刀:别迷信‘实时’,要信‘刚刚好’的实时
最头疼的是支付风控。原系统调用的是阿里云国际版的Real-time Decision API,理论上200ms内返回。但实际平均412ms,峰值超1.2秒。用户点‘确认支付’后盯着转圈圈,3秒没反应,83%的人会切后台查微信余额,再回来时订单已过期。
我们拆开看链路:请求→WAF→API网关→风控服务(调用3个微服务+1次外部征信查询)→返回。问题出在‘征信查询’——它依赖新加坡本地一家第三方,SLA写着‘99%请求<800ms’,但那是P99,不是P50。
解法很反直觉:不优化它,绕开它。
阿里云企业账号出售 我们在阿里云国际版的Edge Node Service(ENS)节点上,部署了一个极简缓存层:对过去24小时所有成功支付的设备指纹(MD5(device_id+os_version)),存入本地LevelDB。如果当前请求的设备指纹命中缓存,且近3天无拒付记录,直接放行,跳过全部后端校验。缓存失效策略是‘写时失效+定时巡检’,由FC函数每15分钟同步一次主库变更。
效果?支付链路P95延迟从412ms压到78ms。误拦率下降63%,因为大量‘老老实实买酱油的老用户’再也不用被当成风险分子审三遍。
最后说句实在话
阿里云国际版不是银弹,它不会自动帮你识别黑产。但它像一把瑞士军刀:WAF够细,FC够轻,Redis够稳,ENS够近,API网关够灵活。真正起作用的,是你敢不敢把‘高大上’的模型先扔一边,蹲下来,看日志里凌晨两点半那3800次登录是怎么喘气的。
风控不是越严越好,是让用户感觉不到你在防他,却让黑产觉得你在盯他呼吸。
现在那家电商的KPI表,‘用户投诉率’那栏,终于被老板用绿色荧光笔圈起来了。他说下周要请我们吃榴莲——我婉拒了,怕吃完风控策略突然变松。

