阿里巴巴|阿里研发AI技术0.15秒识别拦截外语脏话图 覆盖近30个语种( 二 )


通过一年多努力研究,阿里安全算法团队对这些点进行了逐个突破,通过改进多语言样本生成方案与多语种识别模型框架,在多种图片语言的识别上做到了高识别率,以及做到识别1张脏话图只需0.15秒的速度,目前该技术也已应用在阿里多项国际业务中,总体识别准确率可达95%以上,并对各种艺术字体、复杂背景以及手写图进行了针对性识别优化 。
其实,脏话拦截只是多语种OCR识别技术应用的场景之一,阿里安全国际风控小二文萱介绍,在交互场景里,违规信息中还有大部分属于垃圾信息 。
现在,基于阿里安全的算法能力,每天仅单个国际平台就为全球用户拦截几万次包含危险、辱骂、垃圾文本的多语言脏话图片 。阿里安全图灵实验室算法负责人薛晖表示:“期待以科技创新解决实际业务问题,帮助造就更好的网络环境和网络安全 。”