工行里的数字员工是怎么来的?

工行里的数字员工是怎么来的?
文章图片
导语:对于银行业来说 , 数字员工可以通过自然语言对话、语音等低门槛的人机交互模式 , 降低企业中后台软件的操作复杂度 , 达到节省企业用工成本的目的 。 那么 , 数字员工应该如何构建呢?
《新程序员005:开源深度指南&新金融背后的技术力量》特邀中国工行软件研发中心来分享他们在数字化员工建设方面的实践与总结 , 通过对意图识别、对话抽取、模型蒸馏、回流学习等技术的介绍 , 对用户理解进行了深入探索 。
作者|工行软件开发中心责编|张红月出品|《新程序员》编辑部近年来 , 商业银行在经营精细化管理上的要求日益增加 , 因而中后台业务系统处理的功能也日趋复杂 , 业务人员参与到业务开展中的劳动成本日渐增高 。 为解决这些痛点问题 , 中国工商银行开展了数字员工的探索 , 通过大数据平台、机器学习等基础技术底座 , 依据数据中台的数据资产 , 实现通过对话交互方式快速获取数据资产、调度业务服务的业务处理模式 。
工行里的数字员工是怎么来的?】同时 , 为实现数字员工响应迅速、交互体验良好的效果 , 工行软件开发中心在技术上通过NLP多轮对话实现了理解用户意图 , 并通过良好的人机交互工程设计 , 达到了这一目标 。
本文节选自《新程序员005:开源深度指南&新金融背后的技术力量》 , 本期杂志将开源开发者最关注的核心开发者与技术栈 , 以及与企业最关心的开源行业化应用以及商业化前景、治理风险等问题进行深度解析 。
与此同时 , 还将围绕“新金融背后的科技力量”带来最前沿的观点、实践案例与技术剖析!小伙伴可扫码下方二维码提前预定!
用户理解探索:意图识别、对话抽取、模型蒸馏、回流学习
数字人作为用自然语言与用户交互的人工智能系统 , 基于用户意图识别、对话实体抽取、模型蒸馏、回流数据学习等核心技术组成的AI中枢 , 通过人机交互来完成与用户的沟通 。
智能对话交互的模型算法部分包括实时联机和离线两部分(见图1) , 实时联机部分是对用户请求实时响应 , 离线部分主要完成模型训练、测试与知识库整理 。
工行里的数字员工是怎么来的?
文章图片
图1智能对话交互框架
智能对话交互体系的技术核心要点主要有以下四个方面:
用户意图识别
用户意图识别是指通过文本分类的方法将问题分到对应的意图种类 , 准确识别用户真实意图 , 缩短交互时间 , 提升用户体验 。 在中后台业务场景中 , 意图识别一般分为2层 , 领域识别和每个领域下的用户行为意图识别 。 领域识别通常发生在多个业务方接入 , 但不同业务方之间未做节点物理隔离的场景 , 需要根据用户请求判断属于哪个业务领域 。 每个领域下的用户行为意图识别是指业务领域下对服务进一步划分 , 如信贷领域下的泛知识查询、业务知识检索、报表录入与下载、闲聊等 。 从领域识别到领域下的用户行为意图识别 , 用户意图得以更精确地识别 , 数字人得以更好地理解用户 , 更智能地提供相关服务 。
在模型选择方面 , 综合考虑数据特点、业务场景等因素 , 最终选择BERT模型作为意图识别模型结构(见图2) 。 BERT模型是一种自编码语言模型 , 采用transformerencoder部分 , 通过Masked语言模型和nextsentence预测两个任务预训练 , 快速迁移到下游任务中 。 实践中结合特定场景的数据对该模型进行微调 , 即可达到良好的效果 。