阿里巴巴|与变异风险词赛跑,阿里探索AI治理网络风险

阿里巴巴|与变异风险词赛跑,阿里探索AI治理网络风险

最近 , 阿里安全一线风控小二可粒发现 , 在禁售的风险防控库里 , 有人试图“上新”新品种 , 不法份子借助在社交媒体上走红的“魔法改运”等说辞 , 引人入玄学骗局 。
尽量提前发现风险问题 , 提早布防是阿里安全风控部门的日常工作 。 “但是 , 风险对抗是不断升级的 , 各类风险词不断变异试图躲避各家平台管控 , 如果单靠人力防控 , 只会是杯水车薪 。 ”可粒说 。
针对类似具有行业共性的风险治理难题 , 业界和学界推动以技术创新探索网络风险治理 。 今年中国中文信息学会语言与知识计算专业委员会主办了“CCKS 2021通用百科知识图谱实体类型推断”比赛 , 邀请国内283支队伍参赛 。 12月25日 , 比赛结果出炉 , 阿里安全升级包含封建迷信、软色情、野生动植物保护、血腥暴力等重难点风险治理域在内的AI技术获得第一名 。

“CCKS 2021通用百科知识图谱实体类型推断”竞赛公布获奖情况
【阿里巴巴|与变异风险词赛跑,阿里探索AI治理网络风险】阿里安全高级风控专家杜衡介绍 , 阿里安全在平台部署了上述新升级的新一代安全架构核心AI能力 , 让AI对风险商品进行“联想” , 以此对抗突发新增、变异的风险商品 。 此前阿里风控平台对多类风险商品出台了明确的管理规则 , 进行了禁售规范 , 今年绿网计划则针对相关风险词 , 上线了科普宣导 。
虽然该AI技术在竞赛的公开数据集上获得了突出的成果 , 但据阿里安全反馈 , 技术应用在真实环境中遇到了更多难题 。
阿里安全算法工程师科蓝解释 , 第一个难点是商家发现相关风险词被平台管控后 , 立马试图用新词代替 , 为了让AI的能力跟上变异的节奏 , 甚至提前布防 , AI会基于风险防控经验以及公共新闻事件等 , 自动挖掘一些新词 , 并对这些词进行扩充解释 , 让AI系统理解这些词的真正含义和匹配的风险场景 , 最后候选风险词还要经过运营的人工校验 。
“相当于你在跟一个不断易容、换衣服的人赛跑 , 他跑着跑着就换一层皮 , 你得找准对手 , 不停地往前跑 。 ”科蓝说 , 目前依靠AI自动搜寻生产的非正常风险词汇 , 最终被人工运营审核后的采纳率为60% , 逐步降低了人工寻找新风险词的成本 , 同时尽量提升覆盖更多风险区域的效率 。
第二个难点是 , 除了风险词变异速度快 , 平台发现有些商家会以正常商品介绍的“外套”引导消费者到其他社交工具上进行沟通和成交 。
“这种情况比较难以通过某种技术防控 , 一方面我们通过各种渠道向商家进行合规知识的宣导 , 一方面也希望互联网平台联合起来 , 针对此类风险共同探索合作治理机制 。 ”杜衡说 。
该AI目前升级覆盖到17个风险场景 。 阿里安全资深算法专家薛晖介绍 , 阿里安全在加大技术治理风险场景的投入 , 比如建立人工智能治理与可持续发展的新型实验室 , 与顶尖高校联合发起“安全AI挑战者计划”等项目 , 培养实战型AI人才 。
“要强调的是 , AI技术不是万能的 , 平台遇到各种风险变异与挑战也正说明 , 治理多类风险场景将是持续的博弈 , 但使用技术进行风险治理是其中一个发展方向 , 我们还在继续提升AI联想的准确率 , 希望依靠科技创新构建更清朗的平台环境 , 探索如何更好地解决大众遇到的网络安全风险问题 。 ”薛晖说 。