识别规则
1. 简介
1.1 功能简介
简道云提供多套OCR识别模版供您选择,不同模板支持识别的内容不一样,用于储存内容的字段类型也不一样。本篇内容将介绍文字识别的识别规则。
1.2 应用场景
- 边境安检、酒店登记、银行开户等场景中,文字识别可以用于自动识别和提取身份证和护照上的信息,如姓名、性别、出生日期、国籍等。
- 纳税申报场景下,文字识别可以用于自动识别和提取增值税发票上的信息,如购买方纳税人识别号、销售方纳税人识别号、合计金额、合计税额等。
1.3 预期效果
以识别增值税发票为例:
2.设置步骤
2.1 设置入口
进入编辑页面,选中需要设置的文字识别字段,在右侧工具栏中点击「字段属性 >> 识别内容」,选定「识别内容」后,点击「识别规则设置」进行设置。
2.2 识别规则
识别规则主要分为内容选择和存储规则:
1)内容选择:识别内容可以选择模板中的一个或者多个内容项进行识别。
2)存储规则:存储规则可以是存储到新字段,也可以是存储到已有字段。
- 存储到新字段:点击「完成」自动添加与所勾选内容类型匹配的字段,并自动设置好一一对应规则,无需手动操作。效果如图所示:
- 存储到已有字段:根据识别内容提前添加好与内容匹配的字段类型,并手动设置好对应规则。若已添加的字段的字段名称与被识别的内容的名称一致,且支持的字段类型也符合,则在进行规则设置时自动匹配,管理员只需对未匹配的内容进行设置。效果如图所示:
2.3 识别示例
这里附上不同模板下支持识别的内容以及储存不同内容所需要的字段类型。
表头释义:
- 识别内容:该场景下支持识别的内容。
- 字段类型:支持存储该字段的字段类型。
- 默认字段:当存储规则选择「存储到新字段」时,为对应内容添加的字段的默认类型。
2.3.1 通用文字
识别内容 | 字段类型 | 默认字段 |
识别原件 | 图片字段 | 图片字段 |
识别内容 | 单行文本、多行文本 | 单行文本 |
2.3.2 身份证
识别内容 | 字段类型 | 默认字段 |
身份证人像面原件 | 图片字段 | 图片字段 |
姓名 | 单行文本、多行文本 | 单行文本 |
性别 | 单行文本、多行文本 | 单行文本 |
出生日期 | 单行文本、多行文本、日期时间 | 日期时间 |
民族 | 单行文本、多行文本 | 单行文本 |
地址 | 单行文本、多行文本、地址字段 | 地址字段 |
身份证号 | 单行文本、多行文本 | 单行文本 |
身份证国徽面原件 | 图片字段 | 图片字段 |
发证机关 | 单行文本、多行文本 | 单行文本 |
有效期限起始日期 | 单行文本、多行文本、日期时间 | 日期时间 |
有效期限结束日期 | 单行文本、多行文本、日期时间 | 日期时间 |
2.3.3 增值税发票
点击查看示例:增值税发票识别示例演示
识别内容 | 字段类型 | 默认字段 |
发票原件 | 图片字段 | 图片字段 |
发票类型 | 单行文本、多行文本 | 单行文本 |
发票名称 | 单行文本、多行文本 | 单行文本 |
发票代码 | 单行文本、多行文本、数字字段 | 单行文本 |
发票校验码 | 单行文本、多行文本、数字字段 | 单行文本 |
发票号码 | 单行文本、多行文本、数字字段 | 单行文本 |
发票日期 | 单行文本、多行文本、日期时间 | 日期时间 |
密码区 | 单行文本、多行文本 | 单行文本 |
购买方名称 | 单行文本、多行文本 | 单行文本 |
购买方纳税人识别号 | 单行文本、多行文本 | 单行文本 |
购买方地址/电话 | 单行文本、多行文本 | 单行文本 |
购买方开户行及账号 | 单行文本、多行文本 | 单行文本 |
销售方名称 | 单行文本、多行文本 | 单行文本 |
销售方纳税人识别号 | 单行文本、多行文本 | 单行文本 |
销售方地址/电话 | 单行文本、多行文本 | 单行文本 |
销售方开户行及账号 | 单行文本、多行文本 | 单行文本 |
合计金额 | 单行文本、多行文本、数字字段 | 数字字段 |
合计税额 | 单行文本、多行文本、数字字段 | 数字字段 |
价税合计(大写) | 单行文本、多行文本 | 单行文本 |
价税合计(小写) | 单行文本、多行文本、数字字段 | 数字字段 |
货物或应税劳务/服务名称 | 单行文本、多行文本 | 单行文本 |
规格型号 | 单行文本、多行文本 | 单行文本 |
数量 | 单行文本、多行文本、数字字段 | 数字字段 |
单位 | 单行文本、多行文本 | 单行文本 |
金额 | 单行文本、多行文本、数字字段 | 数字字段 |
税率 | 单行文本、多行文本、数字字段 | 数字字段 |
税额 | 单行文本、多行文本、数字字段 | 数字字段 |
备注 | 单行文本、多行文本 | 单行文本 |
收款人 | 单行文本、多行文本 | 单行文本 |
复核人 | 单行文本、多行文本 | 单行文本 |
开票人 | 单行文本、多行文本 | 单行文本 |
注:
1)货物或应税劳务/服务名称、规格型号、单位额外支持:子表单的单行文本/多行文本。
2)数量、金额、税率、税额额外支持:子表单的单行文本/多行文本/数字字段。
3)货物或应税劳务/服务名称、规格型号、单位、数量、金额、税率、税额需要注意以下逻辑规则:
- 如果匹配给主字段,则返回发票明细数组中全部值,使用分隔符分隔;
- 如果匹配给子字段,则返回发票明细数组中所有的值,每一条值填充为一条子记录,最多返回前200条。
2.3.4 营业执照
识别内容 | 字段类型 | 默认字段 |
营业执照原件 | 图片字段 | 图片字段 |
注册号/社会保障号 | 单行文本、多行文本 | 单行文本 |
企业名称 | 单行文本、多行文本 | 单行文本 |
企业类型 | 单行文本、多行文本 | 单行文本 |
地址 | 单行文本、多行文本 | 单行文本 |
法定代表人 | 单行文本、多行文本 | 单行文本 |
注册资本 | 单行文本、多行文本 | 单行文本 |
营业期限 | 单行文本、多行文本、日期时间 | 单行文本 |
经营范围 | 单行文本、多行文本 | 单行文本 |
2.3.5 驾驶证
识别内容 | 字段类型 | 默认字段 |
驾驶证原件 | 图片字段 | 图片字段 |
证号 | 单行文本、多行文本 | 单行文本 |
姓名 | 单行文本、多行文本 | 单行文本 |
性别 | 单行文本、多行文本 | 单行文本 |
国籍 | 单行文本、多行文本 | 单行文本 |
住址 | 单行文本、多行文本、地址字段 | 地址字段 |
出生日期 | 单行文本、多行文本、日期时间 | 日期时间 |
初次领证日期 | 单行文本、多行文本、日期时间 | 日期时间 |
准驾车型 | 单行文本、多行文本 | 单行文本 |
有效期限起始日期 | 单行文本、多行文本、日期时间 | 日期时间 |
有效期限结束日期 | 单行文本、多行文本、日期时间 | 日期时间 |
2.3.6 行驶证
识别内容 | 字段类型 | 默认字段 |
行驶证原件 | 图片字段 | 图片字段 |
号码号牌 | 单行文本、多行文本 | 单行文本 |
车辆类型 | 单行文本、多行文本 | 单行文本 |
所有人 | 单行文本、多行文本 | 单行文本 |
住址 | 单行文本、多行文本、地址字段 | 地址字段 |
使用性质 | 单行文本、多行文本 | 单行文本 |
品牌型号 | 单行文本、多行文本 | 单行文本 |
车辆识别代号 | 单行文本、多行文本 | 单行文本 |
发动机号码 | 单行文本、多行文本、数字字段 | 数字字段 |
注册日期 | 单行文本、多行文本、日期时间 | 日期时间 |
发证日期 | 单行文本、多行文本、日期时间 | 日期时间 |
2.3.7 银行卡
识别内容 | 字段类型 | 默认字段 |
银行卡原件 | 图片字段 | 图片字段 |
银行卡卡号 | 单行文本、多行文本、数字字段 | 单行文本 |
银行卡有效期 | 单行文本、多行文本、日期时间 | 日期时间 |
银行卡类型 | 单行文本、多行文本 | 单行文本 |
银行名称 | 单行文本、多行文本 | 单行文本 |
2.3.8 火车票
识别内容 | 字段类型 | 默认字段 |
火车票原件 | 图片字段 | 图片字段 |
车票号 | 单行文本、多行文本 | 单行文本 |
始发站 | 单行文本、多行文本 | 单行文本 |
车次号 | 单行文本、多行文本 | 单行文本 |
到达站 | 单行文本、多行文本 | 单行文本 |
出发日期 | 单行文本、多行文本、日期时间 | 日期时间 |
车票金额 | 单行文本、多行文本、数字字段 | 数字字段 |
席别 | 单行文本、多行文本 | 单行文本 |
乘客姓名 | 单行文本、多行文本 | 单行文本 |
身份证号 | 单行文本、多行文本 | 单行文本 |
序列号 | 单行文本、多行文本 | 单行文本 |
售站 | 行文本、多行文本 | 单行文本 |
3. 注意事项
1)文字识别字段暂不支持设置公式,也不支持被公式调用。
2)文字识别字段不支持作为查询和选择数据的字段。
3)文字识别字段不支持作为前端事件的触发字段/返回值字段。
以上单指文字识别字段的逻辑,当识别内容赋值到具体字段后,遵照字段本身的属性设置,例如数字字段设置0位小数,识别内容为 6.887,自动转化为 7,填写到该数字字段中。同时,识别内容所对应的具体字段也是可以触发前端事件/公式/数据联动的。