百度云文字识别插件

当您需要使用百度云文字识别插件时，可以参考以下文档进行配置和使用。

1. 插件介绍

1.1 功能介绍

您可以通过该接口将 印刷或手写的文字从图像、纸质文档或扫描文件 中提取并转换为
可编辑、可搜索的文本 。

1.2 效果展示

注意：此部分展示了身份证识别接口使用后的效果。
其它接口的效果将在后面展示。

2. 使用前配置

2.1 注册企业所属的百度云账号

注册企业账号并登录百度智能云平台。
在右上角头像处点击立即认证,完成企业实名认证。

2.2 创建应用

进入文字识别控制台,依次点击应用列表-创建应用。

输入应用的相关信息并勾选应用能调用的相关接口后点击创建。

2.3 保存应用相关信息

回到应用列表,得到配置的应用信息。

进入会众云平台，选择名为 “应用信息” 功能表单。
点击右上方的 “+记录” 按钮，填写刚刚获取的相关信息后点击 “提交”。

选择刚刚新增的自建应用信息,点击 “手动刷新token” 按钮。

注意

温馨提示：所有自建应用的token每隔15天会自动刷新,如果没有刷新可以手动刷新或检查一下自建应用的基础信息是否正确。

2.4 开通相应的接口

回到百度云平台,点击概览,找到对应的接口并开通它(平台支持的接口在文档后面有介绍)。

信息

温馨提示：所有的接口都有一定的免费体验次数,当免费次数消耗完了后才会开启付费。

3. 通用文字识别相关接口使用说明

3.1 通用文字识别（标准版）

描述 : 基于业界领先的深度学习技术，提供多场景、多语种、高精度的整图文字检测和识别服务。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。
是否检测语言	`是否`	是否检测语言，默认不检测，即：false。当前支持中文、英语、日语、韩语。
是否输出段落信息	`是否`	是否输出段落信息。 - true: 输出 - false: 不输出。
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “通用文字识别（标准版）” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别结果回填后,最后点击 “提交” 按钮。

3.2 通用文字识别（标准含位置版）

描述: 在通用文字识别的基础上，返回文字在图片中的位置信息，方便用户进行版式的二次处理。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否定位单字符位置	`文本`	是否定位单字符位置，big：不定位单字符位置，默认值；small：定位单字符位置。
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否检测语言	`是否`	是否检测语言，默认不检测，即：false。当前支持中文、英语、日语、韩语。
是否输出段落信息	`是否`	是否输出段落信息。 - true: 输出 - false: 不输出。
是否返回文字外接多边形顶点位置	`是否`	是否返回文字外接多边形顶点位置，不支持单字位置。默认为false。
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。
返回的文字外接多边形顶点位置虽然为文本类型数据,但是内容是为"[{"x":00,"y":00},{"x":11,"y":11}]"的json格式数据。

使用示例

选择名为 “通用文字识别（标准含位置版）” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.3 通用文字识别(高精度版)

描述: 在通用文字识别的基础上，提供更高精度的识别服务，支持更多语种识别（丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语、泰语、越语、阿拉伯语、印地语及部分中国少数民族语言），并将字库从1w+扩展到2w+，能识别所有常用字和大部分生僻字。。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - auto_detect：自动检测语言 - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语 - DAN：丹麦语 - DUT：荷兰语 - MAL：马来语 - SWE：瑞典语 - IND：印尼语 - POL：波兰语 - ROM：罗马尼亚语 - TUR：土耳其语 - GRE：希腊语 - HUN：匈牙利语 - THA：泰语 - VIE：越南语 - ARA：阿拉伯语 - HIN：印地语
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否输出段落信息	`是否`	是否输出段落信息。 - true: 输出 - false: 不输出。
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。
是否开启行级别的多方向文字识别	`是否`	是否开启行级别的多方向文字识别，可选值包括: - true：识别 - false：不识别若图内有不同方向的文字时，建议将此参数设置为“true”。

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “ 通用文字识别(高精度版) ” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.4 通用文字识别（高精度含位置版）

描述: 提供多场景、多语种、高精度的整图文字检测和识别服务，支持生僻字识别，并支持 25 种语言识别，相对于通用文字识别（含位置信息版）该产品精度更高，但是识别耗时会稍长。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - auto_detect：自动检测语言 - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语 - DAN：丹麦语 - DUT：荷兰语 - MAL：马来语 - SWE：瑞典语 - IND：印尼语 - POL：波兰语 - ROM：罗马尼亚语 - TUR：土耳其语 - GRE：希腊语 - HUN：匈牙利语 - THA：泰语 - VIE：越南语 - ARA：阿拉伯语 - HIN：印地语
单字符结果的输出方式	`文本`	表示识别语言类型为「中英文（CHN_ENG）」的情况下，英文的单字符结果是按照单词（word）维度输出还是字母（letter）维度输出，当是否定位单字符位置 =small 时生效。
是否定位单字符位置	`文本`	是否定位单字符位置，big：不定位单字符位置，默认值；small：定位单字符位置。
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否返回文字外接多边形顶点位置	`是否`	是否返回文字外接多边形顶点位置，不支持单字位置。默认为false。
是否输出段落信息	`是否`	是否输出段落信息。 - true: 输出 - false: 不输出。
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。
是否返回单字符置信度	`是否`	是否返回单字符置信度，默认不返回，当 recognize_granularity = small 时，参数有效。可选值包括： - true：返回单字符置信度， - false：不返回单字符置信度
是否开启行级别的多方向文字识别	`是否`	是否开启行级别的多方向文字识别，可选值包括: - true：识别 - false：不识别若图内有不同方向的文字时，建议将此参数设置为“true”。

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。
段落的多边形轮廓点坐标和段落的最小外包矩形点坐标虽然为文本类型数据,但是内容是为"[{"x":00,"y":00},{"x":11,"y":11}]"的json格式数据。

使用示例

选择名为 “ 通用文字识别（高精度含位置版）” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.5 办公文档识别

描述: 支持对各类办公文档进行版面分析和文字识别，输出图、表、印章、标题等元素及位置信息，并分版块输出文字识别结果。 可支持中、英、日、韩、法等 20+ 语言类型，印刷、手写、混排等多种场景。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - auto_detect：自动检测语言 - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语 - DAN：丹麦语 - DUT：荷兰语 - MAL：马来语 - SWE：瑞典语 - IND：印尼语 - POL：波兰语 - ROM：罗马尼亚语 - TUR：土耳其语 - GRE：希腊语 - HUN：匈牙利语 - THA：泰语 - VIE：越南语 - ARA：阿拉伯语 - HIN：印地语
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
文字类型	`文本`	文字类型。默认：手写印刷混排识别 - handwring_only：手写文字识别 - handprint_mix：手写印刷混排识别
是否识别并输出印章相关信息	`是否`	是否识别并输出印章相关信息。默认为false
是否输出段落信息	`是否`	是否输出段落信息。 - true: 输出 - false: 不输出。
是否检测并识别公式	`是否`	是否检测并识别公式，公式以Latex格式返回。默认为false。
是否先擦除水印、印章后再识别文档	`是否`	是否先擦除水印、印章后再识别文档。默认为false
是否识别并输出下划线	`是否`	是否识别并输出下划线，默认false

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。
下划线坐标信息和公式的位置信息虽然为文本类型数据,但是内容为json格式数据。

使用示例

选择名为 “ 办公文档识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.6 网络图片文字识别

描述: 针对网络图片进行专项优化，支持识别艺术字体或背景复杂的文字内容。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否检测语言	`是否`	是否检测语言，默认不检测。当前支持（中文、英语、日语、韩语）
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “ 网络图片文字识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.7 网络图片文字识别（含位置版）

描述: 支持识别艺术字体或背景复杂的文字内容，除文字信息外，还可返回每行文字的位置信息、行置信度，以及单字符内容和位置等。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。
是否定位单字符位置	`是否`	是否定位单字符位置，big：不定位单字符位置，默认值；small：定位单字符位置

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。
单字符识别结果虽然为文本类型数据,但是内容为json格式数据。

使用示例

选择名为 “ 网络图片文字识别（含位置版）” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

3.8 手写文字识别

描述: 支持对各类手写文字进行检测和识别，包括中、英、日、韩、法等 20+ 语言类型，可按单字维度输出置信度、候选字等信息。针对手写作文场景，支持涂改痕迹检测。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否定位单字符位置	`是否`	是否定位单字符位置，big：不定位单字符位置，默认值；small：定位单字符位置
是否返回识别结果中每一行的置信度	`是否`	是否返回识别结果中每一行的置信度。
是否检测图像朝向	`是否`	是否检测图像朝向，默认false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括: - true: 检测朝向 - false: 不检测朝向。输入非正向图片时，若想要达到较好识别效果，建议将此参数设置为“true”
是否检测涂改痕迹	`是否`	是否检测涂改痕迹，适用于手写作文场景，默认不检测，可选值包括： true：检测，涂改痕迹部分用“☰”返回； false：不检测
识别语言类型	`文本`	识别语言类型，默认为CHN_ENG,可选值包括: - auto_detect：自动检测语言 - CHN_ENG：中英文混合 - ENG：英文 - JAP：日语 - KOR：韩语 - FRE：法语 - SPA：西班牙语 - POR：葡萄牙语 - GER：德语 - ITA：意大利语 - RUS：俄语 - DAN：丹麦语 - DUT：荷兰语 - MAL：马来语 - SWE：瑞典语 - IND：印尼语 - POL：波兰语 - ROM：罗马尼亚语 - TUR：土耳其语 - GRE：希腊语 - HUN：匈牙利语 - THA：泰语 - VIE：越南语 - ARA：阿拉伯语 - HIN：印地语

提示

图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。
单字符识别结果虽然为文本类型数据,但是内容为json格式数据。

使用示例

选择名为 “ 手写文字识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4. 卡证文字识别相关接口使用说明

4.1 身份证识别

描述 : 支持对二代居民身份证正反面所有8个字段进行结构化识别，包括姓名、性别、民族、出生日期、住址、身份证号、签发机关、有效期限，识别准确率超过99%；同时支持身份证正面头像检测，并返回头像切片的base64编码及位置信息。

同时，支持对用户上传的身份证图片进行图像质量和风险检测，是否存在正反颠倒、模糊、欠曝、过曝等质量问题，可识别图片是否为复印件或临时身份证，是否被翻拍或编辑，是否存在四角不完整、头像或关键字段被遮挡。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否检测上传的身份证被PS	`是否`	是否检测上传的身份证被PS，默认不检测。可选值： -true：检测 - false：不检测。
是否开启身份证风险类型	`是否`	是否开启身份证风险类型（身份证复印件、临时身份证、身份证翻拍、修改过的身份证）检测功能，默认不开启，即：false。 - true：开启，请查看返回参数身份证风险类型； - false：不开启。
是否开启身份证质量类型	`是否`	是否开启身份证质量类型（清晰模糊、边框/四角不完整、头像或关键字段被遮挡/马赛克）检测功能，默认不开启，即：false。 - true：开启，请查看返回参数质量类型； - false：不开启。
是否检测头像内容	`是否`	是否检测头像内容，默认不检测。可选值：true-检测头像并返回头像的 base64 编码及位置信息。
是否检测身份证进行裁剪	`是否`	是否检测身份证进行裁剪，默认不检测。可选值：true-检测身份证并返回证照的 base64 编码及位置信息。
是否检测上传的身份证图片方向	`是否`	是否检测上传的身份证图片方向，默认不检测。可选值： -true：检测 - false：不检测

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “身份证识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4.2 银行卡识别

描述 : 支持对主流银行卡的卡号、有效期、发卡行、卡片类型、持卡人、银行卡号位置 6 个关键字段进行结构化识别， 识别准确率超过99%。同时支持返回银行卡号的字段位置坐标，及开启银行卡质量类型检测。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否返回银行卡号的字段位置坐标	`是否`	是否返回银行卡号的字段位置坐标，默认为 false，即不返回。可选值： - true：返回 - false：不返回
是否开启银行卡质量类型检测功能	`是否`	是否开启银行卡质量类型（清晰模糊、边框/四角不完整）检测功能，默认不开启，即：false。 - true：开启，请查看返回参数质量类型； - false：不开启

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “银行卡识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4.3 营业执照识别

描述: 支持对不同版式营业执照的证件编号、社会信用代码、单位名称、地址、法人、类型、成立日期、有效日期、经营范围等关键字段进行结构化识别。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否开启风险类型功能	`是否`	是否开启风险类型功能，默认不开启，即：false。 - false：不开启 - true：开启
是否开启质量类型检测功能	`是否`	是否开启质量类型（清晰模糊、边框/四角不完整）检测功能，默认不开启，即：false。 - true：开启，结果请查看返回参数质量类型 - false：不开启

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “营业执照识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4.4 社保卡识别

描述: 支持识别全国各地社保卡，支持识别社会保障卡号、姓名、性别、出生日期、银行卡号、有效期限等8个字段。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	是否必填	描述
图像数据	`图片`		图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`		图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “社保卡识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4.5 护照识别

描述: 支持对中国大陆护照个人资料页所有15个字段进行结构化识别，包括国家码、护照号、姓名、姓名拼音、性别、出生地点、出生日期、签发地点（不支持境外签发地）、签发日期、有效期、签发机关、护照类型、国籍、MRZCode1、MRZCode2。接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	是否必填	描述
图像数据	`图片`		图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`		图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “护照识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

4.6 户口本识别

描述: 支持对户口本内常住人口登记卡的全部 22 个字段，包括户号、姓名、与户主关系、性别、出生地、民族、出生日期、身份证号、本市县其他住址、曾用名、籍贯、宗教信仰、身高、血型、文化程度、婚姻状况、兵役状况、服务处所、职业、何时由何地迁往本市、何时由何地迁往本址、登记日期。

支持对户口本内户主页的5个字段进行结构化识别，包括户别、户主姓名、户号、住址、户主页时间。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
识别成员类型	`文本`	-subpage：默认值，常住人口登记卡（成员页） -homepage：户主页

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “户口本识别” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

5. 文档图像处理相关接口使用说明

5.1 文档矫正增强

描述: 对图片中的文件、卡证、票据等内容进行四角点检测定位，提取主体内容并对其进行矫正，同时可选图片增强效果进一步提升图片清晰度，达到主体检测矫正并增强的目的，提升图片整体质量。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
选择是否对图片内主体内容进行四角点增强或矫正	`数值`	选择是否对图片内主体内容进行四角点增强或矫正，可选值如下： - scan_type = 1：只做检测，不对主体进行矫正，返回主体四角点坐标，可用作前端页面展示 - scan_type = 2：只做矫正，需传入主体四角点坐标，使用传入的坐标值对主体进行扣取及矫正 - scan_type = 3：默认值，检测并矫正，返回主体在原图中的四角点坐标以及矫正后的图像
选择是否开启图像增强功能	`数值`	选择是否开启图像增强功能，如开启可选择增强效果，可选值如下： - enhance_type =0：默认值，不开启增强功能 - enhance_type = 1：去阴影 - enhance_type = 2：增强并锐化 - enhance_type = 3：黑白滤镜

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “文档矫正增强” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

5.2 文档去手写

描述: 去除图片中的手写内容，保留印刷体内容，可用于试卷去手写还原等场景。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	描述
图像数据	`图片`	图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`	图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。
是否去除文件边缘后再识别	`是否`	是否去除文件边缘后再识别，默认为 true，可选值： - true：去除，适用于有背景/边缘的拍摄件 - false：不去除，适用于不含背景/边缘的扫描件

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “文档去手写” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

5.3 图片去摩尔纹

描述: 去除翻拍电脑、手机等显示屏照片中的摩尔纹，使图片更加清晰。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	是否必填	描述
图像数据	`图片`		图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`		图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “图片去摩尔纹” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

5.4 文档图片去底纹

描述: 自动识别并去除文档图片中的底纹，使图片更加清晰，便于阅读。

接口调用效果如下:

参数说明

接口调用时，需要传入以下参数：

参数名	类型	是否必填	描述
图像数据	`图片`		图像数据，支持jpg/jpeg/png/bmp格式。
图片完整url	`文本`		图片完整url，url长度不超过1024字节，支持jpg/jpeg/png/bmp格式。

提示

温馨提示：图像数据和图片完整url需要二选一填写一个,且优先级: 图像数据 > url 。

使用示例

选择名为 “文档图片去底纹” 功能表单
点击右上方的 “+记录” 按钮

按照引导填写相关数据，点击 “查询” 按钮。
等待识别信息回填后,最后点击 “提交” 按钮。

6. 常见问题

Q1: 如何检查接口是否成功调用？

答：您可以在工作流中查看调用业务流程的日志。

百度云文字识别插件 ​

1. 插件介绍 ​

1.1 功能介绍 ​

1.2 效果展示 ​

2. 使用前配置 ​

2.1 注册企业所属的百度云账号 ​

2.2 创建应用 ​

2.3 保存应用相关信息 ​

2.4 开通相应的接口 ​

3. 通用文字识别相关接口使用说明 ​

3.1 通用文字识别（标准版） ​

3.2 通用文字识别（标准含位置版） ​

3.3 通用文字识别(高精度版) ​

3.4 通用文字识别（高精度含位置版） ​

3.5 办公文档识别 ​

3.6 网络图片文字识别 ​

3.7 网络图片文字识别（含位置版） ​

3.8 手写文字识别 ​

4. 卡证文字识别相关接口使用说明 ​

4.1 身份证识别 ​

4.2 银行卡识别 ​

4.3 营业执照识别 ​

4.4 社保卡识别 ​

4.5 护照识别 ​

4.6 户口本识别 ​

5. 文档图像处理相关接口使用说明 ​

5.1 文档矫正增强 ​

5.2 文档去手写 ​

5.3 图片去摩尔纹 ​

5.4 文档图片去底纹 ​

6. 常见问题 ​

Q1: 如何检查接口是否成功调用？ ​

百度云文字识别插件

1. 插件介绍

1.1 功能介绍

1.2 效果展示

2. 使用前配置

2.1 注册企业所属的百度云账号

2.2 创建应用

2.3 保存应用相关信息

2.4 开通相应的接口

3. 通用文字识别相关接口使用说明

3.1 通用文字识别（标准版）

3.2 通用文字识别（标准含位置版）

3.3 通用文字识别(高精度版)

3.4 通用文字识别（高精度含位置版）

3.5 办公文档识别

3.6 网络图片文字识别

3.7 网络图片文字识别（含位置版）

3.8 手写文字识别

4. 卡证文字识别相关接口使用说明

4.1 身份证识别

4.2 银行卡识别

4.3 营业执照识别

4.4 社保卡识别

4.5 护照识别

4.6 户口本识别

5. 文档图像处理相关接口使用说明

5.1 文档矫正增强

5.2 文档去手写

5.3 图片去摩尔纹

5.4 文档图片去底纹

6. 常见问题

Q1: 如何检查接口是否成功调用？