1.字段说明
OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
简而言之,就是将图片上的字符信息转换为可编辑的文字内容。简道云提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,用户只需简单配置,即可实现强大的文字转换处理。
2.应用场景
早期受限于技术发展水平,OCR只能应用在一些特定的图像识别,如车牌号识别,并形成一系列专门识别的终端设备,研发及使用成本高、应用范围窄。随着科技的进步与发展,OCR逐渐下沉到我们日常生活中,成为一项基本能力,且不再受限于单一的终端设备,电脑端、手机端、pad端及其他对接的专用设备均可以通过OCR技术来完成业务操作。应用范围也越来越广,银行、地产、教育、医疗、政务及生活中的方方面面都能看到OCR的应用。
如,银行身份认证场景中,只需提交身份证信息,OCR就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;在企业资质审核场景中,通过上传营业执照,OCR将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。整个提交、校验、审核流程,不到3分钟就能搞定,一改原有的低效人工审核,为政务工作降本提效。
3.操作配置
简道云通过「文字识别」字段来实现图像的标准化识别,市面上主流的OCR业务均可以通过「文字识别」字段来实现,配置也非常简单。
① 首先,我们从左侧字段面板中选择「文字识别」字段拖拽添加到表单设计面板中。
② 添加好字段后选择需要使用的场景去配置,简道云支持以下场景的OCR识别:
- 通用文字
- 身份证
- 增值税发票
- 营业执照
- 驾驶证
- 行驶证
- 银行卡
- 火车票
③ 选择好识别的场景后,就需要设置识别的规则。
如身份证识别场景中,可以识别身份证正反面原件及姓名、性别等具体内容,识别后的内容将一一存储表单中去,那么还需要选择储存的字段。
- 存储到新字段:点击「完成」自动添加与所勾选内容类型匹配的字段,并自动设置好一一对应规则,无需手动操作。
- 存储到已有字段:根据识别内容需提前添加与内容匹配的字段类型,并设置好一一对应规则。
④ 我们以发票识别为例添加一个识别规则。
从上图可以看出,整个发票识别表单从设计到配置不到10秒即可完成,无需开发,无需寻找适配接口对接,更不需要专业的技术人员去维护。
4.多端使用
除了管理员开发配置简单,成员使用也十分便捷。只需上传需要识别的内容,由系统自动填写,更支持PC端、移动端、Pad端等多端同步使用。无论是办公室管理人员还是一线操作工人,都可以通过OCR快速完成数据录入工作。
还以发票识别为例来演示OCR在PC端和移动端的数据录入。
5.识别规则
在设置识别规则时需要根据内容一一匹配存储字段,下一篇文档中我们将详细讲解识别规则的配置。
参考文档: 识别规则配置
6.付费与购买
文字识别功能所有版本均可使用,每个用户会赠送30次免费识别次数,使用完赠送次数后,管理员可以按需要购买文字识别次数包。
购买入口:
1.表单设计处:表单设计
>> 文字识别字段
>> 字段属性
>> 识别次数
>> 立即购买
;
2.企业管理后台:企业管理
>> 版本信息
>> 文字识别次数
>> 购买识别次数
。
购买价格:
每个文字识别次数包50元,含1000次识别次数,一次可叠加购买多个包。
7.日志查询
管理员可以在企业管理中查询文字识别日志。
在识别日志中可以查看操作人、识别时间、消耗次数以及是否成功等基本信息。若识别失败则不会扣除账户剩余识别次数。
识别日志仅保留最近六个月的识别信息。
8.注意事项
1.OCR识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
2.OCR识别非100%精准,目前市面上的接口均无法保证100%识别,上传的内容越清晰越容易被识别。
3.OCR识别成功率非100%成功,目前我们调用的是百度OCR识别接口,具体技术限制还可以参考百度官方文件。