画像|用户画像在风控实战中的应用( 二 ) 半导体|封装|中电中金|ipd|5g|厦

但所谓“道高一尺魔高一丈”，黑产的攻击手法不断的变换，原有的策略规则会进入相应的“失效期”。而感知到这一变化，可借助画像的标签内容进行水位的统计展示，以此来快速感知到。
例如：恶意占库存场景，可以查看下单率超过一定阈值用户的占比，与之前的正常占比进行比较，来感知到规则是否正在失效。
2. 单用户的风险下探集中在客诉场景，C端用户被拦截后发起客诉，运营同学需要对风控拦截做出相应的解释，即对拦截的规则进行解释。
注意，上面讲到风控画像主要是标签库，规则依赖标签库，如果仍然是以标签库进行解释，那么意味着规则必须100%准确，太难了。
所以，在画像中，仍然需要构建风险的下探链路。构建的思路是基于用户实际发生的业务数据、行为数据、订单数据，进行反向的验证。
例如：切换设备频次过高和时速异常被拦截，那么在画像中则以详细列表的方式展示用户近N天的登录记录（因为切设备就要重新登录），在登录记录中列出设备的IMEI、设备指纹、经纬度、和登录时间，以这些数据来帮助运营进行定性。
因此，画像要支持用户风险标签的提炼，同时还要支持对于这些标签的解释。
3. 用户群组的挖掘风险的攻防，不是单一用户的攻防，而是群体的攻防和管控，而群体中的用户表现，往往是具有相似度的。
画像是单一用户的标签集，此时可通过标签集的相似度对相似用户进行挖掘。
当然，必须承认，准确率不高，比如：下单率低，很多小姐姐只看不买，太正常了。因此往往是多个维度相加来做相似度挖掘。同时再借助关系图谱，将用户之间的强关联属性提炼出来，一个简单的群组就产生了。
而此时用户的标签，则会上升到群组，形成群组的标签，群组画像。
三、构建画像中的难点1. 标签的实时性画像中的标签，多则几千个，少则也有几百个，如果全部要求实时或者离线，前者造成计算资源的浪费，后者造成线上风险的漏过。
在这里，则采取一个原则来进行分类：标签的增益，即该标签在风险中的影响力 + 标签本身的动态性。
标签本身的动态性：一般是指标签的更新频率，例如身份信息，基本是不会变的；用户近30分钟的切换设备数量，这种是30分钟要重新统计的。
标签在风险中的影响力：举个例子，30分钟内用户切换设备超过3个，这个不能定义为用户有风险；30分钟内用户切换了虚拟设备超过3个，这个可以认定为用户有风险。因此前者的实时性要求不高，但后者就要求实时。
因此，在实战中，跟风控规则强关联的，往往是实时性要求高的。
2. 标签的完整度是否所有的用户，标签体系都要建设成一样的，比如活跃用户和刚注册的新户是否一样？
这里，需要借助一个分类思想：业务场景 – 用户角色 – 用户价值 – 用户风险度，将此定义为一个空间，每往下走一级，则建设的标签内容就不一样。这个方式，有助于后续不断枚举并迭代补充遗漏的信息维度。
3. 标签的区分度实际上，不是每个标签都会被用到，也不是每个标签都能代表用户，也就是无效标签。往往建设一个标签，用该标签对用户进行分层，无论是阈值多少，发现动不动就是80%+的用户被圈在一起，这就代表该标签是无效的。
这里有一个小的检验方式，即通过该标签 + 风险阈值，将用户进行白户、黑户、灰户的分层，如果其实现的比例接近1:8:1，则代表该标签具有一定的区分度。
当然，像年龄、城市、性别这些基础中的基础标签，是不能使用这种方式的。