域名|互联网反诈:一场技术驱动的“攻坚战”( 二 )


HOSTS反黑文件作者、反钓鱼专家蒲浪告诉锌刻度:“那时 , 安全厂商每天鉴定的钓鱼网站数量在8000个~10000个 , 而每天新增的钓鱼网站上万个 , 总有钓鱼网站成为漏网之鱼 , 威胁网民安全 。 ”
网络安全厂商对此的解决办法就是提取钓鱼诈骗网站的“DNA” , 提升安全工具对钓鱼诈骗网站的识别能力 , 从而提前进行拦截 , 遏制泛滥趋势 。
与10年前不同 , 现在超级互联网平台早已意识到企业安全风控能力建设的重要性 , 都建设了自身的安全技术团队 。 同样 , 应对网络诈骗 , 也需要建设网络诈骗的“DNA”库 。
从前面的几类基础资源及引流手段看 , 目前网络诈骗团伙的“DNA”大致可以分布在几类载体上:IP地址、设备、文本、图片、视频及链接等 。 《抖音网络诈骗打击治理报告》显示 , 抖音为了打击网络诈骗 , 基于这几类载体 , 建立了百亿级样本量的风控数据库 。
这些拥有海量样本的风控数据库 , 和人的DNA一样 , 我们用户根本看不到 , 但风控数据库可以说是所有互联网平台打击治理网络诈骗的基石 , 能够帮助互联网平台及时及早发现网络诈骗团伙的违规批量注册、引流内容发布等违规行为 。
网络诈骗模型与策略研发:对症开药方拥有了“DNA”库 , 怎么用?
一个IP地址 , 被网络诈骗团伙用来违规批量注册抖音账号 , 被平台发现并收录入风险IP库 , 如果网络诈骗团伙再试图利用该IP地址发布引流诈骗内容 , 就能够被第一时间发现并拦截阻断 。
上述的发现拦截阻断 , 可能有网友会说 , 这不就是简单的数据匹配么?我在大街上看见一个骗子 , 穿着白T恤、黑牛仔裤 , 戴着鸭舌帽 , 梳着汉奸头 , 下次再看到 , 对上了 , 就知道这是个骗子 , 他的话不能信 。
听起来似乎简单 , 然而实际案例中 , 网络诈骗行为打击的复杂度要远高于此 。
仍以IP地址为例 , 网络诈骗团伙总会发现自己的IP地址已经被封禁不能使用 , 就会去购买新的IP地址作恶 。 新的IP地址并不在互联网平台的风控数据库里 , 那么如何对网络诈骗团伙的犯罪行为进行打击?
这就需要互联网平台基于风控数据库 , 针对网络诈骗团伙建立系统的识别体系 , 包括针对账号、内容、行为及设备等多种因素进行识别 。
比如账号识别 , 同样是评论“说的真好 , 给你点赞”这样的文本 , 网络诈骗账号可能使用 , 普通用户账号也会使用 。 那么显然无法简单粗暴地进行匹配识别 , 需要结合文本内容、行为与设备做综合的识别能力建设 。 举例来说 , 账号A在某个视频下留言“说的真好 , 给你点赞” , 如果之后该账号去观看其他视频 , 并且偶尔点赞、偶尔留言 , 且点赞时间不一、留言内容不一 , 这可能是我们普通用户的行为 。
但是 , 如果是一个涉嫌“交友诈骗”的账号B , 在精准诈骗的同时为了提升效率 , 可能会呈现几方面特点:一是文本上留言内容大多保持一致 , 二是大多选择在女性账号下面留言 , 三是留言行为频率比较频繁 , 四是留言之后还会有关注行为甚至私信行为 。
那么 , 反过来 , 如果平台想要通过账号识别体系打击“交友诈骗” , 应该怎么做?可以通过上面这几个特点想办法找出这类账号进行处罚 。
这种情况下 , 通过人工去筛选肯定不现实 。 如果抖音希望这么做 , 估计招一百万人也难做到 。

最有效的办法 , 通过深度学习、机器学习等人工智能技术 , 去挖掘网络诈骗账号的特征 , 研发对应的模型与策略进行识别、打击 。 这实际上有点类似于对症下药 , 模型、策略 , 有些像是药方 。