文字识别(OCR)
1. 简介
1.1 字段简介
文字识别也叫 OCR(optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
简而言之,就是将图片上的字符信息转换为可编辑的文字内容。简道云提供的「文字识别」字段支持通用文字、身份证、增值税发票、营业执照、驾驶证、行驶证、银行卡以及火车票的识别,只需简单配置,即可实现强大的文字转换处理。
1.2 应用场景
- 银行身份认证场景中,只需提交身份证信息,OCR 就能自动识别出身份证上的姓名、性别、地址等信息并填报到系统中;
- 在企业资质审核场景中,通过上传营业执照,OCR 将营业执照的注册号、企业名称等信息识别出并填报到系统中,再通过营业执照校验接口,自动完成企业资质校验。
1.3 预期效果
从下图可以看出,整个发票识别表单从设计到配置不到 10 秒即可完成,无需开发,无需寻找适配接口对接,更不需要专业的技术人员去维护。
1.4 版本说明
本功能为付费高级功能,需简道云标准版及以上版本可用,使用时需消耗云币。详情参见:【4. 付费与充值】。
2. 操作步骤
1)首先,在表单中添加「文字识别」字段:
注:文字识别字段目前仅支持在主表中添加,不支持在子表单中添加。
2)添加好字段后选择需要识别的内容进行配置,简道云支持以下内容的 OCR 识别:通用文字/身份证/增值税发票/营业执照/驾驶证/行驶证/银行卡/火车票。
3)确认需要识别的内容后,根据内容设置识别规则,具体规则详情参见:识别规则。
3. 多端使用
除了管理员设计、配置简单,成员使用也十分便捷。只需上传需要识别的图片,即可由系统自动填写,更支持 PC 端、移动端、Pad 端等多端同步使用。无论是办公室管理人员还是一线操作工人,都可以通过 OCR 快速完成数据录入工作。下面以增值税发票为例演示演示 PC 端与移动端文字识别过程:
- PC 端:
- 移动端:
4. 付费与充值
4.1 付费规则
文字识别为付费功能,每次文字识别根据识别类型不同,将消耗不同的 云币 数量。具体如下:
OCR 识别类型 | 定价(元/次) |
通用文字 | 0.005 |
身份证 | 0.020 |
增值税发票 | 0.050 |
营业执照 | 0.030 |
驾驶证 | 0.040 |
行驶证 | 0.040 |
银行卡 | 0.020 |
火车票 | 0.040 |
在识别时自动扣除云币数量,当云币余额可支付的识别次数为 0 时,文字识别将无法识别使用。
云币余额显示在「识别内容」旁的说明中:
4.2 公共模式充值
- 企业管理
创建者可以在「企业管理>> 版本信息」中进行云币充值。
云币充值详情参见:云币。
4.3 集成模式充值
集成模式的用户暂不支持自主增购,可以 联系我们 充值或咨询商务:400-111-0890 转 2 号线。
5. 文字识别日志
管理员可以在「企业管理>> 版本信息」中查询文字识别日志。
在识别日志中可以查看操作人、识别时间、消耗次数以及是否成功等基本信息。识别日志仅保留最近六个月的识别信息。
若识别失败则不会扣除云币数量。
6. 智能识别插件
除文字识别字段外,简道云还上线了多款智能识别插件,付费版用户可在 插件市场 进行安装和使用。
1)智能识别插件具体如下优势:
- 除文字识别字段默认的几项识别内容外,智能识别插件支持更多识别类型;
- 文字识别暂时只能在主表中使用,智能识别类插件还可以在子表单中调用,满足更多使用需求;
- 发票识别插件 中,除增值税发票外,还支持识别 PDF 电子票、机动车发票、火车票、定额票、出租车发票、行程单、通用机打发票、机动车销售统一发票等。
2)目前已上线 4 款智能识别插件,使用方法及安装链接如下:
使用方法 | 安装链接 | 备注 |
注:
1)成员不具备插件市场权限,链接会打不开;普通管理员不具备插件安装权限,但可以查看插件详情;系统管理员及企业创建者可以查看并安装插件;
2)后续,开放平台还将推出更多识别类型的插件供大家选择,如您有相关需求,可通过 填写表单 反馈给我们。
7. 注意事项
1)OCR 识别后不论是否储存原文件,都将消耗附件量。(附件量指的是附件流量,上传即消耗)
2)OCR 识别非 100% 精准,目前市面上的接口均无法保证 100% 识别,上传的内容越清晰越容易被识别。目前我们调用的是百度 OCR 识别接口,具体技术限制还可以参考百度官方文件。
3)购买云币所产生的费用可以开具发票,发票开具的规则参考文档:发票与合同。