文字识别 - 图1 文字识别

  • 通用文字识别
  • 通用文字识别
  • 手写文字识别
  • 印刷文字识别
  • 印刷文字识别(多语种)
  • 印刷文字识别(多语种) intsig
  • 图片文档还原
  • 通用票证识别
  • 国内通用票据识别 sinosecu
  • 离线OCR
  • 名片识别 intsig
  • 身份证识别 intsig
  • 银行卡识别 intsig
  • 营业执照识别 intsig
  • 增值税发票识别 intsig
  • 拍照速算识别
  • 公式识别
  • 指尖文字识别

通用文字识别 API 文档

#接口说明

  • 通用文字识别(Universal Character Recognition),基于深度神经网络模型的端到端文字识别系统,将图片中印刷或手写的文字转化为计算机可编码的文字(目前支持中文、英文)。
  • 部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
    通用文字识别demo java语言
    通用文字识别demo python语言
  • 集成通用文字识别时,需按照以下要求:
内容 说明
传输方式 http[s] (为提高安全性,强烈推荐https)
请求地址 http[s]: //api.xf-yun.com/v1/private/sf8e6aca1 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用
请求行 POST /v1/private/sf8e6aca1 HTTP/1.1
接口鉴权 签名机制,详情请参照下方鉴权说明
字符编码 UTF-8
响应格式 统一采用JSON格式
开发语言 任意,只要可以向讯飞云服务发起HTTP请求的均可
适用范围 任意操作系统,但因不支持跨域不适用于浏览器
图片格式 jpg/jpeg/png/bmp
图片大小 base64编码后大小不超过4M

#鉴权说明

在调用业务接口时,请求方需要对请求进行签名,服务端通过签名来校验请求的合法性。
通过在请求地址后面加上鉴权相关参数的方式,请注意影响鉴权结果的值有url、apiSecret、apiKey、date,如果调试鉴权,请务必按照示例中给的值进行调试 # 通用文字识别 intsig API 文档-多种 ## #接口说明 + 通用文字识别 intsig(Universal Character Recognition),基于深度神经网络模型的端到端文字识别系统,将图片中印刷或手写的文字转化为计算机可编码的文字。该通用文字识别接口支持语种包括:中、日、韩、英、德、法等52种语言,详细请参照语种列表 + 部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
通用文字识别 intsig demo java语言
通用文字识别 intsig demo python语言 + 集成通用文字识别 intsig时,需按照以下要求:

语种列表:

Language 语言
汉语 汉语
漢語 繁体汉语
日本語 日语
한국어 韩语
English 英语
Français 法语
Português 葡萄牙语
Deutsch 德语
Italiano 意大利语
Nederlands 荷兰语
Svenska 瑞典语
Suomi 芬兰语
Dansk 丹麦语
Norsk 挪威语
Magyar 匈牙利语
Tiếng Việt 越南语
Afrikaans 南非语
shqip 阿尔巴尼亚语
Euskara 巴斯克语
Català 加泰罗尼亚语
Hrvatski 克罗地亚语
Čeština 捷克语
Eesti keel 爱沙尼亚语
Íslenska 冰岛语
Gaeilge 爱尔兰语
Latine 拉丁语
Latviešu 拉脱维亚语
Lietuvių 立陶宛语
Melayu 马来语
Polski 波兰语
Română 罗马尼亚语
Slovenčina 斯洛伐克语
Slovenščina 斯洛文尼亚语
Swahili 斯瓦希里语
Türkçe 土耳其语
Cymraeg 威尔士语
Malti 马耳他语
Kreyòl 克里奥尔语
Galego 加利西亚语
Esperanto 世界语
Filipino 菲律宾语
Indonesia 印度尼西亚语
Azərbaycan 阿塞拜疆语
Español 西班牙语
Русский 俄语
български 保加利亚语
Македонски 马其顿语
Українська 乌克兰语
Српски 塞尔维亚
БССР 白俄罗斯语
Ελληνικά 希腊语
Հայ 亚美尼亚语

常见问题-t 4M-

#通用文字识别的主要功能是什么?

答:将图片中印刷或手写的文字转化为计算机可编码的文字,目前支持中文、英文。

#通用文字识别支持什么应用平台?

答:目前支持Web API应用平台。

#通用文字识别对图片有什么要求吗?

答:图片格式支持jpg格式、jpeg格式、png格式、bmp格式,且需保证图像文件大小base64编码后不超过4MB。

拍照速算识别 API 文档-教育

#接口说明

拍照速算识别基于深度学习的端到端识别技术,自动识别图片中的速算题并智能批改,返回标准LaTeX公式及批改结果。覆盖K12教育范围内15种题型,支持口算、竖式、方程、脱式计算等,详细请参照 速算题型 。支持的场景有印刷体、手写体、拍照场景。 该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

#接口要求

速算题型

No. 题型名称 题型示例
1 四则混合运算 文字识别 - 图2
2 带题标号的四则混合运算 文字识别 - 图3
3 已知结果求运算因子 文字识别 - 图4
4 填写“<” “>” “=” 文字识别 - 图5
5 填最大数、最小数 文字识别 - 图6
6 约等于估算 文字识别 - 图7
7 带余除数法 文字识别 - 图8
8 相邻数 文字识别 - 图9
9 分数四则运算 文字识别 - 图10
10 单位换算 文字识别 - 图11
11 竖式加减法 文字识别 - 图12
12 竖式乘除法 文字识别 - 图13
13 脱式运算 文字识别 - 图14
14 解方程 文字识别 - 图15
15 求平方 文字识别 - 图16

#调用示例

注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用

拍照速算识别demo python3语言

拍照速算识别demo java语言

拍照速算识别demo nodejs语言

拍照速算识别demo php语言

注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

#图片样例

拍照速算识别 图片样例 JPG文件

拍照速算识别 图片样例 PNG文件

拍照速算识别 图片样例 BMP文件

注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。

#视频教程

如何分分钟实现速算题的自动批改

#常见问题

#拍照速算识别的主要功能是什么?

答:拍照速算识别基于深度学习的端到端识别技术,自动识别图片中的速算题并智能批改,返回标准LaTeX公式及批改结果。

#拍照速算识别支持什么应用平台?

答:目前支持Web API应用平台。

#拍照速算上传什么图片识别效果最佳

答:图片格式仅支持jpeg/png/bmp,图片大小≤2M 建议使用清晰的、算式规整、文字与空白占比较大的照片,效果更好。

#支持的速算题型有哪些

答:四则混合运算、带题标号的四则混合运算、已知结果求运算因子、填写“<”“>”“=”、填最大数/最小数、约等于估算、带余除数法、相邻数、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式运算、解方程、求平方。

#拍照速算交互次数怎么收费

答:拍照速算免费100000次/天调用,超过可在控制台申请提额

公式识别 API 文档

#接口说明

公式识别是将图片(来源如扫描仪或数码相机)中的数学公式及题干,转换化为可编辑的标准LaTeX公式及文本。覆盖小学、初中、高中等多种题型,详细请参照 公式题型 。目前仅支持拍照印刷体,拍照手写体、扫描印刷体、扫描手写体等后期逐步开放,敬请期待。 该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

#接口要求

公式题型

No. 题型名称 题型示例
1 平面直角坐标系 文字识别 - 图17
2 一元二次方程 文字识别 - 图18
3 概率初步cz 文字识别 - 图19
4 函数及其图像 文字识别 - 图20
5 解直角三角形 文字识别 - 图21
6 平面几何 文字识别 - 图22
7 投影与视图 文字识别 - 图23
8 代数 文字识别 - 图24
9 实数与二次根 文字识别 - 图25
10 三角形 文字识别 - 图26
11 相似形 文字识别 - 图27
12 分式 文字识别 - 图28
13 统计初步(初中) 文字识别 - 图29
14 圆锥曲线方程 文字识别 - 图30
15 直线和圆方程 文字识别 - 图31
16 直线和平面 文字识别 - 图32
17 三角函数 文字识别 - 图33
18 复数 文字识别 - 图34
19 概率初步gz 文字识别 - 图35
20 函数和投影 文字识别 - 图36
21 推理和证明 文字识别 - 图37
22 平面向量 文字识别 - 图38

#错误码

备注:如出现下述列表中没有的错误码,可到 这里 查询。
错误码 错误描述 说明 处理方式
10029 ITRGetResultJson Error 服务调用失败 检查图片格式是否符合要求
10222 received message larger than max 上传数据超过最大限制 检查上传图片是否超过了4M(base64编码后超过4M)
10313 invalid app_id appid不合法 检查appid是否正确

#调用示例

注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用

公式识别demo python3语言

公式识别demo java语言

公式识别demo nodejs语言

公式识别demo php语言

注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

#图片样例

公式识别 图片样例 JPG文件

公式识别 图片样例 PNG文件

公式识别 图片样例 BMP文件

注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。

#常见问题

#公式识别支持什么应用平台?

答:目前支持Web API应用平台。

#公式识别上传什么图片识别效果最佳

答:图片格式仅支持jpeg/png/bmp,图片大小base64编码后≤4M 建议使用清晰的、算式规整、文字与空白占比较大的照片,效果更好。

#公式识别交互次数怎么收费

答:公式识别免费500次/天调用,超过可在控制台申请提额。

指尖文字识别 API 文档-手写web

#接口说明

指尖文字识别,可检测图片中指尖位置,将指尖处文字转化为计算机可编码的文字。
该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

#接口要求

集成指尖文字识别API时,需按照以下要求。
内容 说明
传输方式 http[s] (为提高安全性,强烈推荐https)
请求地址 http[s]: //tyocr.xfyun.cn/v2/ocr 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用
请求行 POST /v2/ocr HTTP/1.1
接口鉴权 签名机制,详情请参照下方接口鉴权
字符编码 UTF-8
响应格式 统一采用JSON格式
开发语言 任意,只要可以向讯飞云服务发起HTTP请求的均可
适用范围 任意操作系统,但因不支持跨域不适用于浏览器
图片属性 图片分辨率500W像素以上,或者500W像素图片中的部分裁剪区域,图片中文字的高度最好大于24像素,且包含不少于两个指节以上的手部区域
图片格式 jpg/png/bmp
图片大小 不超过4M
文本语种 中英文

#接口调用流程

· 通过接口密钥基于hmac-sha256计算签名,将签名以及其他参数放在Http Request Header中。详见下方 鉴权认证
· 将请求参数以及图片数据放在Http Request Body中,以POST表单的形式提交,详见下方 请求参数
· 向服务器端发送Http请求后,接收服务器端的返回结果。

#白名单

默认关闭IP白名单,即该服务不限制调用IP。
在调用该业务接口时
  • 若关闭IP白名单,接口认为IP不限,不会校验IP。
  • 若打开IP白名单,则服务端会检查调用方IP是否在讯飞开放平台配置的IP白名单中,对于没有配置到白名单中的IP发来的请求,服务端会拒绝服务。
IP白名单规则
  • 在 控制台-相应服务的IP白名单处编辑,保存后五分钟左右生效;
  • 不同Appid的不同服务都需要分别设置IP白名单;
  • IP白名单需设置为外网IP,请勿设置局域网IP;
  • 如果握手阶段返回{“message”:”Your IP address is not allowed”},则表示由于IP白名单配置有误或还未生效,服务端拒绝服务。

#鉴权认证

在调用业务接口时,须对HTTP请求进行签名,服务端通过签名来识别用户并验证其合法性。

#鉴权方法

错误码
备注:如出现下述列表中没有的错误码,可到 这里 查询。

错误码 错误描述 说明 处理方式
10222 received message larger than max 上传数据超过最大限制 检查上传图片是否超过了4M
10313 invalid app_id appid不合法 检查appid是否正确
10909 IFREAD_WRAPPER_ERR_RUNTIME
非法数据 接口执行错误 1. 检查参数设置是否正确,图片格式是否符合要求

  1. 手指检测失败,调整手指摆放问题
  2. ocr识别失败,确认所指区域是否有文字以及文字是否清晰

    调用示例

    注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用

指尖文字识别demo python3语言

指尖文字识别demo java语言

指尖文字识别demo nodejs语言

指尖文字识别demo php语言

注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。

图片样例

指尖文字识别 图片样例 JPG文件

指尖文字识别 图片样例 BMP文件

指尖文字识别 图片样例 PNG文件

注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。

常见问题

指尖文字识别支持什么应用平台?

答:目前支持Web API应用平台。

是否支持方向有旋转的文字?

答:支持文字与水平轴小于±15°夹角偏转。

输入图片要求?

答:图片大小4M以内,图片分辨率500W像素以上,或者500W像素图片中的部分裁剪区域,图片中文字的高度最好大于24像素,且包含不少于两个指节以上的手部区域,这样的图片识别效果会更好。