作为计算机视觉领域的重要分支,OCR是人工智能最早的研究领域之一,也是目前相对成熟且应用较多的技术。
OCR能够将PDF文件、图像和纸质文档中的文字自动识别并录入到计算机中。其典型应用就是通过图像文字识别实现信息录入。由于文字和符号包含丰富的语义信息,基于OCR 提取文字信息继而进行分析,能够帮助机器更好地理解图像。
文章插图
随着计算机视觉、自然语言处理和深度学习算法的不断进步,AI-OCR的识别准确率大幅提升,通用性也越来越强。
目前,OCR已在金融、保险、医疗、交通、教育等诸多行业有了深入成熟的应用。随着传统行业的数字化转型,OCR的应用范围和场景将进一步扩展,市场规模将进一步增大。
OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。
实在RPA和OCR的协作
RPA目前活跃在以金融机关代表的企业中,但是这些企业的纸质媒体和打印数据等非电子化的数据仅仅依靠RPA来进行业务处理的话还是相当困难的。这就为RPA技术与OCR技术的协同合作提供了契机。
在只有RPA的情况下,需要员工手动把纸质文件的信息录入到Excel,Word等电子文档中,然后运行RPA机器人读取电子文档中的信息实现业务的自动化处理。
而RPA+OCR的情况下,只需实现扫描好纸质文件,OCR会自动读取扫描文件,将图片信息读取并写入Excel等文档中,然后RPA机器人运行,进行业务处理。这个过程完全替代了人工手动录入,极大地节约了人力成本。
近年来,OCR引起了广泛关注,但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后,相信一定会解决这个课题。
Fax-OCR是什么?
Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司,很多都是网上接单了,但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。尤其是日本的小型公司依然采用这种老旧的接收订单的方式。如果把传真资料自动读入系统将减少大量人工录入的费时操作,同时人工失误也会大幅减少。
OCR的注意点
OCR技术确实可以自动实现数据的文本化,也是一项非常有效的效率改善的技术手段,但是现在的阶段OCR并非无所不能。
【 ocr|为什么说OCR技术是实在智能RPA的眼睛】
1、无法对应多份文件。
一般来说,OCR需要读取文本内容以及文件内容的模板,并定义好抽出的对象数据的位置。但是,由于客户的文件模板并不统一,文件模板和数据坐标位置也不尽相同,这种情况应对起来就比较困难了。所以对于一些既有模板以外的文件要格外注意。
2、文字数据抽出后,必须进行人工确认。
虽然AI-OCR可以通过机器学习技术去识别手写文字,但是很多不清楚,或者写法不鲜明的文字还是很难做到完美识别。因此,数据抽出完毕后还是要通过人去确认数据的正确性。
- 中断|制造业、港口……为何说供应链大中断会在2022年继续发生?
- 电信|移动宽带用户数超过电信,说明消费者只在乎便宜不在乎网速?
- 程序员|华为比亚迪等科技企业开始将一些业务搬出广东,说明了什么问题?
- 太阳能热水器|一夜“消失”的太阳能,为什么突然就不“火”了?三点原因很实在
- Java|1599元的神仙入门显卡开卖,但对大多数人来说这是张智商检测卡
- 新东方在线|同一箱牛奶为何实体店卖50元,网上只卖25元?内行人说出了实话
- 黄继伟|任正非视察基层看到工程师打游戏,遭遇霸气回应,任正非无话可说
- Windows|工信部下达“铁命令”,三大运营商要整改,该与“套餐”说再见了
- oracle|甲骨文这么好的名字,为什么让一个外国公司给注册了?
- 程序员|Netflix评价微软700亿天价收购:说明订阅制才是未来