下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟( 二 )

下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
图的形式是为了更直观地看清楚数据整体情况 , 但很难看到背后的数据 。 所以图表描述功能需要对可视化视图背后的数据进行解读 , 帮助用户更好的了解数据 , 结合自己的行业理解写出完美的分析报告 。 在表格描述的基础上融入了图表的特性 , 针对不同类型的图表可以生成不同的解读 。 例如:柱状图侧重量的对比 , 折线图侧重趋势变化 , 饼图侧重占比等 。 在文本生成过程中 , 我们融合了规则模板和文本生成模型 , 其中为保证文本的可读性 , 文本生成模型采用了一种自监督的可控文本生成方法 。 可控文本生成的目标 , 是控制给定模型基于源文本产生特定属性的文本 。 在数据解读中使用的特定属性包括影响文本的领域、主题、实体和风格等 。
下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
单点解释是对数据表格以及可视化图表中的单个数据点进行解读 , 该数据点须为聚合计算后的数据 , 通过算法结合原始数据可以分析出这条数据的组成、分布以及与其他数据的不同之处 。 通过对数据点进行分析 , 对应原始数据通过机器学习算法自动选择特征、数据建模、模型评估选取得分比较高的特征 , 通过自然语言处理(NLP)对语义进行理解结合槽位填充生成数据解释 。
下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
单点解释主要针对可视化图表底层的数据进行度量值以及独特性两方面解释:度量值指的是组成聚合特征的数据 , 包括(平均值、极端值、记录数、空值)并且分析这些维度对聚合特征预期值的影响 。 预期是我们将原始数据的其他数据作为先验训练数据 , 通过贝叶斯建模 , 标记数据作为预测数据进行运算得出的结果 。 通过分析每个维度对预期值的影响 , 生成相应的数据解读 。 独特性分析主要是为了所选标记与其他数据之间的区别 , 用户可以根据该维度特性进行专业分析 , 挖掘背后的原因 , 引导激发用户分析灵感 。
下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片

nextionBI数据解读效果如何?我们选择目前市场上主流的BI平台进行对比 , 国内包含此功能的平台较少 , 故我们选择国外同样具备该数据解读能力的产品进行功能对比 。 下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
首先我们选择目前数据分析师使用较多的TBI产品进行对比 , 如上图所示 , 针对同一组数据进行数据解读 , 左图为nextionBI解读结果 , 右图为TBI产品的解读结果 。 在描述维度方面 , nextionBI针对于整个表格 , 涵盖了多维度描述信息 , TBI产品只针对于单个数据 , 利用单一贝叶斯模型分析预测 。 在使用范围方面 , nextionBI可适用于多列、多种数据类型组合 , 而TBI产品对维度和数据类型均有一定限制 。
下一代面向知识的 BI 到底有何不同,从 nextionBI 数据解读能力中一探究竟
文章图片
我们也对比了某老牌厂商的PBI产品 , 针对同一数据的完成情况如上图所示 。 nextionBI的结果涵盖了分类、同比、环比、相关性分析、覆盖纵向横向等各个维度的描述信息 , 融合多个模型及规则信息较为丰富 , PBI更多关注统计特性 。 同时nextionBI结果的可读性更强 , 更符合中文数据汇报的表达习惯 , 整体上更加通顺也更易理解 。 总体来说 , nextionBI作为后起之秀 , 在数据解读能力的设计和开发方面 , 全面分析市场上目前的能力水平和核心需求 , 针对性地进行研发和技术攻坚 , 在描述维度、中文可读性、适用范围都积累了自己的优势 。 在本次发布会之后 , 我们将充分收集用户体验之后的反馈 , 不断优化算法设计和功能体验 , 希望最终能让人人尽享数据价值 。