通义千问AI-图片理解场景
1. 简介
1.1 场景简介
图片理解是指利用 AI 技术,智能识别业务场景中各种分辨率和规格的图像信息,并依据单张图像的解析或多张图片的对比,在简道云中通过问答模式实现分析总结,视觉推理,中文文本理解、看图做题等能力。用 AI 手段大幅提升了通用 OCR 识别能力。
1.2 应用场景
适用于不同场景下的图片理解,如 CRM 场景客户聊天记录分析和回复提示、通用场景下的图片理解识别翻译、设备物品标签归类识别、学习场景通过识别图片做题、通过图片对比进行产品信息的比对和推荐等。
1.3 预期效果
以识别 CRM 聊天记录图片为例,智能指导回复话术效果如下所示:
1.4 使用说明
通义千问-图片理解插件为付费插件,每次调用插件消耗 0.025 个 云币。在使用插件时自动扣除云币数量,当云币余额可支付的识别次数为 0 时,将无法使用通义千问插件。
2. 插件安装及配置
2.1 安装插件
1)直接安装
2)插件市场处安装
在简道云「插件市场」处,安装「通义千问」插件。插件市场处安装方法可参见文档:插件市场中【2.3 插件安装】。
2.2 启用插件
在插件管理中,打开「通义千问」插件右侧开关,启用插件。
3. 表单搭建
插件体验可点击右侧链接: 通义千问-图片理解场景表单,插件使用可先安装:通义千问插件模板。本文将按照示例表单进行讲解。
以单个图片的识别为例,新建「图片理解」表单,字段设置如下所示:
字段名称 | 字段类型 |
图片 | 图片 |
提问 | 单行文本 |
回复 | 多行文本 |
4. 前端事件配置
4.1 添加前端事件
进入「表单属性」,点击前端事件下的「设置」,添加前端事件:
4.2 设置事件名称和说明
添加好前端事件后,首先设置前端事件的基础信息,即事件名称和事件说明,用于区分前端事件:
4.3 设置触发动作
设置触发动作:触发字段选择「提问」字段。
4.4 设置执行动作
设置执行动作如下:
- 选择插件:选择「通义千问 >> 图片理解」插件;
- 图片网格路径:设置为字段值,即「图片」字段;
- 提问:设置为字段值,即「提问」字段;
- 字段存储关系:点击「添加」按钮,设置「返回参数」的值存储到「回复」中,设置完成后点击「保存」。
4.5 效果演示
效果参见本文【1.3 预期效果】。
5. 联系方式
该插件为官方合作的服务商开发,若您在使用过程中有任何疑问,可通过以下方式咨询:
- 公司:摇火软件科技(无锡)有限公司
- 联系人:宋经理
- 联系电话:13861732426