文字识别

1.字段说明

OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

简而言之,就是将图片上的字符信息转换为可编辑的文字内容。简道云提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,用户只需简单配置,即可实现强大的文字转换处理。


2.应用场景

早期受限于技术发展水平,OCR只能应用在一些特定的图像识别,如车牌号识别,并形成一系列专门识别的终端设备,研发及使用成本高、应用范围窄。随着科技的进步与发展,OCR逐渐下沉到我们日常生活中,成为一项基本能力,且不再受限于单一的终端设备,电脑端、手机端、pad端及其他对接的专用设备均可以通过OCR技术来完成业务操作。应用范围也越来越广,银行、地产、教育、医疗、政务及生活中的方方面面都能看到OCR的应用。

如,银行身份认证场景中,只需提交身份证信息,OCR就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;在企业资质审核场景中,通过上传营业执照,OCR将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。整个提交、校验、审核流程,不到3分钟就能搞定,一改原有的低效人工审核,为政务工作降本提效。


3.操作配置

简道云通过「文字识别」字段来实现图像的标准化识别,市面上主流的OCR业务均可以通过「文字识别」字段来实现,配置也非常简单。

① 首先,我们从左侧字段面板中选择「文字识别」字段拖拽添加到表单设计面板中。


② 添加好字段后选择需要使用的场景去配置,简道云支持以下场景的OCR识别:

  • 通用文字
  • 身份证
  • 增值税发票
  • 营业执照
  • 驾驶证
  • 行驶证
  • 银行卡
  • 火车票


③ 选择好识别的场景后,就需要设置识别的规则。

如身份证识别场景中,可以识别身份证正反面原件及姓名、性别等具体内容,识别后的内容将一一存储表单中去,那么还需要选择储存的字段。

  • 存储到新字段:点击「完成」自动添加与所勾选内容类型匹配的字段,并自动设置好一一对应规则,无需手动操作。
  • 存储到已有字段:根据识别内容需提前添加与内容匹配的字段类型,并设置好一一对应规则。


④ 我们以发票识别为例添加一个识别规则。

从上图可以看出,整个发票识别表单从设计到配置不到10秒即可完成,无需开发,无需寻找适配接口对接,更不需要专业的技术人员去维护。


4.多端使用

除了管理员开发配置简单,成员使用也十分便捷。只需上传需要识别的内容,由系统自动填写,更支持PC端、移动端、Pad端等多端同步使用。无论是办公室管理人员还是一线操作工人,都可以通过OCR快速完成数据录入工作。

还以发票识别为例来演示OCR在PC端和移动端的数据录入。


5.识别规则

在设置识别规则时需要根据内容一一匹配存储字段,下一篇文档中我们将详细讲解识别规则的配置。

参考文档: 识别规则配置


6.付费与购买

文字识别功能所有版本均可使用,每个用户会赠送30次免费识别次数,使用完赠送次数后,管理员可以按需要购买文字识别次数包。

购买入口:

1.表单设计处:表单设计 >> 文字识别字段 >> 字段属性 >> 识别次数 >> 立即购买

2.企业管理后台:企业管理 >> 版本信息 >> 文字识别次数 >> 购买识别次数

购买价格:

每个文字识别次数包50元,含1000次识别次数,一次可叠加购买多个包。


7.日志查询

管理员可以在企业管理中查询文字识别日志。


在识别日志中可以查看操作人、识别时间、消耗次数以及是否成功等基本信息。若识别失败则不会扣除账户剩余识别次数。
识别日志仅保留最近六个月的识别信息。


8.注意事项

1.OCR识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)

2.OCR识别非100%精准,目前市面上的接口均无法保证100%识别,上传的内容越清晰越容易被识别。

3.OCR识别成功率非100%成功,目前我们调用的是百度OCR识别接口,具体技术限制还可以参考百度官方文件。



本文是否对您有帮助?
 有帮助
 没帮助
您是否遇到了以下问题?
如需获取即时帮助,请联系技术支持