spring|人工智能如何进行数据管理?

spring|人工智能如何进行数据管理?

字数统计:3427字     预计阅读时间:约7分钟



人工智能正在悄然改进数据管理 , 包括其质量、可访问性和安全性 。
但是随着数据越来越多 , 数据管理变得至关重要 。
01One
数据管理的重要性
人工智能正在悄然改进数据管理 , 包括其质量、可访问性和安全性 。
数据管理对于创建数据可以在整个组织中发挥作用的环境至关重要 。 有效的数据管理可以最大限度地减少不良数据引起的问题 , 例如增加摩擦、预测不佳 , 甚至是简单的不可访问性 , 最好是在它们发生之前 。
然而 , 管理数据是一项劳动密集型活动:它涉及清理、提取、集成、编目、标记和组织数据 , 以及定义和执行许多与数据相关的任务 , 这些任务通常会让数据专家和员工感到沮丧他们标题中的“数据” 。
人工智能已经以数千种方式成功应用 , 但其中一种不太明显和不太引人注目的应用是改进数据管理 。 我们认为人工智能在五个常见的数据管理领域发挥着重要作用:
? 分类:广义上包括从文档、照片、手写和其他媒体中获取、提取和构建数据 。
? 编目:帮助定位数据 。
? 质量:减少数据中的错误 。
? 安全性:保护数据免受不良行为者的侵害 , 并确保根据相关法律、政策和习俗使用数据 。
? 数据集成:帮助构建数据的“主列表” , 包括通过合并列表 。
下面 , 我们依次讨论这些领域中的每一个 。 我们还描述了供应商格局以及人类对数据管理必不可少的方式 。
02Two
人工智能对数据管理的影响
单靠技术无法取代良好的数据管理流程 , 例如主动攻击数据质量、确保每个人都了解自己的角色和职责、构建数据供应链等组织结构以及建立关键术语的通用定义 。 但人工智能是一种宝贵的资源 , 可以显着提高生产力和公司从数据中获得的价值 。 以下是人工智能可以对组织中的有效数据管理产生最大影响的五个领域 。
1、数据分类;
数据分类和提取是一个广阔的领域 , 随着越来越多的媒体被数字化以及社交媒体越来越以图像和视频为中心 , 它的规模还在不断扩大 。 在当今的在线环境中 , 如果没有人工智能 , 就不可能大规模地审核内容以识别不当帖子(尽管许多人仍在该领域工作) 。 我们在这个领域包括分类(这是仇恨言论吗?) , 身份/实体解析(这是人还是机器人 , 如果是人 , 是哪一个?) , 匹配(数据库 A 中的 Jane Doe 是否与数据库 B 中的 JE Doe?) , 数据提取(此司法备案中最重要的数据是什么?) , 等等 。
多年来 , 人工智能的原始形式一直用于光学字符识别 (OCR) , 以从银行支票或写有地址的信封等物品中提取重要数据 。 OCR 变得如此普遍 , 以至于我们不再考虑 AI 等功能 。 较新的 AI 系统已通过深度学习模型扩展了 OCR , 这些模型现在能够准确读取人类笔迹 。
人工智能是一种宝贵的资源 , 可以显着提高生产力和公司从数据中获得的价值 。
重要数据通常采用固定的文档格式 , 如传真、PDF 和冗长的文字处理文档 , 为了访问、分析甚至回答相关问题 , 必须先将其提取出来 。 例如 , 在医疗保健领域 , 信息仍然通过传真传递 , 访问它需要大量的人力 。 一家电子病历公司编写了一个人工智能程序 , 从传真中提取数据并将其直接输入到 EHR 系统中 , 从而节省了大量时间 。 人工智能程序还可以从合同中识别和提取重要条款 , 这对律师和审计员等很有用 。