">
- #接口说明">#接口说明
- #鉴权说明">#鉴权说明
- 语种列表:">语种列表:
- ">
- 常见问题-t 4M-">常见问题-t 4M-
  - #通用文字识别的主要功能是什么？">#通用文字识别的主要功能是什么？
  - #通用文字识别支持什么应用平台？">#通用文字识别支持什么应用平台？
  - #通用文字识别对图片有什么要求吗？">#通用文字识别对图片有什么要求吗？
拍照速算识别 API 文档-教育">拍照速算识别 API 文档-教育
- #接口说明">#接口说明
- #接口Demo">#接口Demo
- #接口要求">#接口要求
- 速算题型">速算题型
- #调用示例">#调用示例
- #图片样例">#图片样例
- #视频教程">#视频教程
- #常见问题">#常见问题
  - #拍照速算识别的主要功能是什么？">#拍照速算识别的主要功能是什么？
  - #拍照速算识别支持什么应用平台？">#拍照速算识别支持什么应用平台？
  - #拍照速算上传什么图片识别效果最佳">#拍照速算上传什么图片识别效果最佳
  - #支持的速算题型有哪些">#支持的速算题型有哪些
  - #拍照速算交互次数怎么收费">#拍照速算交互次数怎么收费
公式识别 API 文档">公式识别 API 文档
- #接口说明">#接口说明
- #接口Demo">#接口Demo
- #接口要求">#接口要求
- 公式题型">公式题型
- #错误码">#错误码
- #调用示例">#调用示例
- #图片样例">#图片样例
- #常见问题">#常见问题
  - #公式识别支持什么应用平台？">#公式识别支持什么应用平台？
  - #公式识别上传什么图片识别效果最佳">#公式识别上传什么图片识别效果最佳
  - #公式识别交互次数怎么收费">#公式识别交互次数怎么收费
指尖文字识别 API 文档-手写web">指尖文字识别 API 文档-手写web
- #接口说明">#接口说明
- #接口Demo">#接口Demo
- #接口要求">#接口要求
- #接口调用流程">#接口调用流程
  - #白名单">#白名单
  - #鉴权认证">#鉴权认证
    - #鉴权方法">#鉴权方法
调用示例
图片样例
常见问题
指尖文字识别支持什么应用平台？
是否支持方向有旋转的文字？
输入图片要求？

文字识别 - 图1 文字识别

通用文字识别
- WebAPI文档
通用文字识别
手写文字识别
印刷文字识别
印刷文字识别(多语种)
印刷文字识别(多语种) intsig
图片文档还原
通用票证识别
国内通用票据识别 sinosecu
离线OCR
名片识别 intsig
身份证识别 intsig
银行卡识别 intsig
营业执照识别 intsig
增值税发票识别 intsig
拍照速算识别
公式识别
指尖文字识别

通用文字识别 API 文档

#接口说明

通用文字识别（Universal Character Recognition），基于深度神经网络模型的端到端文字识别系统，将图片中印刷或手写的文字转化为计算机可编码的文字（目前支持中文、英文）。
部分开发语言demo如下，其他开发语言请参照文档进行开发，也欢迎热心的开发者到讯飞开放平台社区分享你们的demo。
通用文字识别demo java语言
通用文字识别demo python语言
集成通用文字识别时，需按照以下要求:

内容	说明
传输方式	http[s] (为提高安全性，强烈推荐https)
请求地址	http[s]: //api.xf-yun.com/v1/private/sf8e6aca1 注：服务器IP不固定，为保证您的接口稳定，请勿通过指定IP的方式调用接口，使用域名方式调用
请求行	POST /v1/private/sf8e6aca1 HTTP/1.1
接口鉴权	签名机制，详情请参照下方鉴权说明
字符编码	UTF-8
响应格式	统一采用JSON格式
开发语言	任意，只要可以向讯飞云服务发起HTTP请求的均可
适用范围	任意操作系统，但因不支持跨域不适用于浏览器
图片格式	jpg/jpeg/png/bmp
图片大小	base64编码后大小不超过4M

#鉴权说明

在调用业务接口时，请求方需要对请求进行签名，服务端通过签名来校验请求的合法性。
通过在请求地址后面加上鉴权相关参数的方式，请注意影响鉴权结果的值有url、apiSecret、apiKey、date，如果调试鉴权，请务必按照示例中给的值进行调试 # 通用文字识别 intsig API 文档-多种 ## #接口说明 + 通用文字识别 intsig（Universal Character Recognition），基于深度神经网络模型的端到端文字识别系统，将图片中印刷或手写的文字转化为计算机可编码的文字。该通用文字识别接口支持语种包括：中、日、韩、英、德、法等52种语言，详细请参照语种列表。 + 部分开发语言demo如下，其他开发语言请参照文档进行开发，也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
通用文字识别 intsig demo java语言
通用文字识别 intsig demo python语言 + 集成通用文字识别 intsig时，需按照以下要求:

语种列表:

Language	语言
汉语	汉语
漢語	繁体汉语
日本語	日语
한국어	韩语
English	英语
Français	法语
Português	葡萄牙语
Deutsch	德语
Italiano	意大利语
Nederlands	荷兰语
Svenska	瑞典语
Suomi	芬兰语
Dansk	丹麦语
Norsk	挪威语
Magyar	匈牙利语
Tiếng Việt	越南语
Afrikaans	南非语
shqip	阿尔巴尼亚语
Euskara	巴斯克语
Català	加泰罗尼亚语
Hrvatski	克罗地亚语
Čeština	捷克语
Eesti keel	爱沙尼亚语
Íslenska	冰岛语
Gaeilge	爱尔兰语
Latine	拉丁语
Latviešu	拉脱维亚语
Lietuvių	立陶宛语
Melayu	马来语
Polski	波兰语
Română	罗马尼亚语
Slovenčina	斯洛伐克语
Slovenščina	斯洛文尼亚语
Swahili	斯瓦希里语
Türkçe	土耳其语
Cymraeg	威尔士语
Malti	马耳他语
Kreyòl	克里奥尔语
Galego	加利西亚语
Esperanto	世界语
Filipino	菲律宾语
Indonesia	印度尼西亚语
Azərbaycan	阿塞拜疆语
Español	西班牙语
Русский	俄语
български	保加利亚语
Македонски	马其顿语
Українська	乌克兰语
Српски	塞尔维亚
БССР	白俄罗斯语
Ελληνικά	希腊语
Հայ	亚美尼亚语

常见问题-t 4M-

#通用文字识别的主要功能是什么？

答：将图片中印刷或手写的文字转化为计算机可编码的文字，目前支持中文、英文。

#通用文字识别支持什么应用平台？

答：目前支持Web API应用平台。

#通用文字识别对图片有什么要求吗？

答：图片格式支持jpg格式、jpeg格式、png格式、bmp格式，且需保证图像文件大小base64编码后不超过4MB。

拍照速算识别 API 文档-教育

#接口说明

拍照速算识别基于深度学习的端到端识别技术，自动识别图片中的速算题并智能批改，返回标准LaTeX公式及批改结果。覆盖K12教育范围内15种题型，支持口算、竖式、方程、脱式计算等，详细请参照速算题型。支持的场景有印刷体、手写体、拍照场景。该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景，比如上传图片识别其中的文字等；相较于SDK，API具有轻量、跨语言的特点。另外，请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

示例demo请点击这里下载。
目前仅提供部分开发语言的demo，其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到讯飞开放平台社区分享你们的demo。

#接口要求

速算题型

No.	题型名称	题型示例
1	四则混合运算
2	带题标号的四则混合运算
3	已知结果求运算因子
4	填写“<” “>” “=”
5	填最大数、最小数
6	约等于估算
7	带余除数法
8	相邻数
9	分数四则运算
10	单位换算
11	竖式加减法
12	竖式乘除法
13	脱式运算
14	解方程
15	求平方

#调用示例

注: demo只是一个简单的调用示例，不适合直接放在复杂多变的生产环境使用

注：其他开发语言请参照接口调用流程进行开发，也欢迎热心的开发者到讯飞开放平台社区分享你们的demo。

#图片样例

拍照速算识别图片样例 JPG文件

拍照速算识别图片样例 PNG文件

拍照速算识别图片样例 BMP文件

注：如果测试过程中，发现图片符合要求但却不能识别，有可能是由于图片的真实格式和文件后缀不符，请通过图片的二进制流的头文件确认图片真实格式，不符合要求需要进行格式转换。

#视频教程

如何分分钟实现速算题的自动批改

#常见问题

#拍照速算识别的主要功能是什么？

答：拍照速算识别基于深度学习的端到端识别技术，自动识别图片中的速算题并智能批改，返回标准LaTeX公式及批改结果。

#拍照速算识别支持什么应用平台？

答：目前支持Web API应用平台。

#拍照速算上传什么图片识别效果最佳

答：图片格式仅支持jpeg/png/bmp，图片大小≤2M 建议使用清晰的、算式规整、文字与空白占比较大的照片，效果更好。

#支持的速算题型有哪些

答：四则混合运算、带题标号的四则混合运算、已知结果求运算因子、填写“<”“>”“=”、填最大数/最小数、约等于估算、带余除数法、相邻数、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式运算、解方程、求平方。

#拍照速算交互次数怎么收费

答：拍照速算免费100000次/天调用，超过可在控制台申请提额

公式识别 API 文档

#接口说明

公式识别是将图片（来源如扫描仪或数码相机）中的数学公式及题干，转换化为可编辑的标准LaTeX公式及文本。覆盖小学、初中、高中等多种题型，详细请参照公式题型。目前仅支持拍照印刷体，拍照手写体、扫描印刷体、扫描手写体等后期逐步开放，敬请期待。该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景，比如上传图片识别其中的文字等；相较于SDK，API具有轻量、跨语言的特点。另外，请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

#接口要求

公式题型

No.	题型名称	题型示例
1	平面直角坐标系
2	一元二次方程
3	概率初步cz
4	函数及其图像
5	解直角三角形
6	平面几何
7	投影与视图
8	代数
9	实数与二次根
10	三角形
11	相似形
12	分式
13	统计初步（初中）
14	圆锥曲线方程
15	直线和圆方程
16	直线和平面
17	三角函数
18	复数
19	概率初步gz
20	函数和投影
21	推理和证明
22	平面向量

#错误码

备注：如出现下述列表中没有的错误码，可到这里查询。

错误码	错误描述	说明	处理方式
10029	ITRGetResultJson Error	服务调用失败	检查图片格式是否符合要求
10222	received message larger than max	上传数据超过最大限制	检查上传图片是否超过了4M（base64编码后超过4M）
10313	invalid app_id	appid不合法	检查appid是否正确

#调用示例

注: demo只是一个简单的调用示例，不适合直接放在复杂多变的生产环境使用

注：其他开发语言请参照接口调用流程进行开发，也欢迎热心的开发者到讯飞开放平台社区分享你们的demo。

#图片样例

公式识别图片样例 JPG文件

公式识别图片样例 PNG文件

公式识别图片样例 BMP文件

#常见问题

#公式识别支持什么应用平台？

答：目前支持Web API应用平台。

#公式识别上传什么图片识别效果最佳

答：图片格式仅支持jpeg/png/bmp，图片大小base64编码后≤4M 建议使用清晰的、算式规整、文字与空白占比较大的照片，效果更好。

#公式识别交互次数怎么收费

答：公式识别免费500次/天调用，超过可在控制台申请提额。

指尖文字识别 API 文档-手写web

#接口说明

指尖文字识别，可检测图片中指尖位置，将指尖处文字转化为计算机可编码的文字。
该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景，比如上传图片识别其中的文字等；相较于SDK，API具有轻量、跨语言的特点。另外，请注意该接口使用的HTTP API协议不支持跨域。

#接口Demo

#接口要求

集成指尖文字识别API时，需按照以下要求。

内容	说明
传输方式	http[s] (为提高安全性，强烈推荐https)
请求地址	http[s]: //tyocr.xfyun.cn/v2/ocr 注：服务器IP不固定，为保证您的接口稳定，请勿通过指定IP的方式调用接口，使用域名方式调用
请求行	POST /v2/ocr HTTP/1.1
接口鉴权	签名机制，详情请参照下方接口鉴权
字符编码	UTF-8
响应格式	统一采用JSON格式
开发语言	任意，只要可以向讯飞云服务发起HTTP请求的均可
适用范围	任意操作系统，但因不支持跨域不适用于浏览器
图片属性	图片分辨率500W像素以上，或者500W像素图片中的部分裁剪区域，图片中文字的高度最好大于24像素，且包含不少于两个指节以上的手部区域
图片格式	jpg/png/bmp
图片大小	不超过4M
文本语种	中英文

#接口调用流程

· 通过接口密钥基于hmac-sha256计算签名，将签名以及其他参数放在Http Request Header中。详见下方鉴权认证。
· 将请求参数以及图片数据放在Http Request Body中，以POST表单的形式提交，详见下方请求参数。
· 向服务器端发送Http请求后，接收服务器端的返回结果。

#白名单

默认关闭IP白名单，即该服务不限制调用IP。
在调用该业务接口时

若关闭IP白名单，接口认为IP不限，不会校验IP。
若打开IP白名单，则服务端会检查调用方IP是否在讯飞开放平台配置的IP白名单中，对于没有配置到白名单中的IP发来的请求，服务端会拒绝服务。

IP白名单规则

在控制台-相应服务的IP白名单处编辑，保存后五分钟左右生效；
不同Appid的不同服务都需要分别设置IP白名单；
IP白名单需设置为外网IP，请勿设置局域网IP；
如果握手阶段返回{“message”:”Your IP address is not allowed”}，则表示由于IP白名单配置有误或还未生效，服务端拒绝服务。

#鉴权认证

在调用业务接口时，须对HTTP请求进行签名，服务端通过签名来识别用户并验证其合法性。

#鉴权方法

错误码
备注：如出现下述列表中没有的错误码，可到这里查询。

错误码错误描述说明处理方式
10222 received message larger than max 上传数据超过最大限制检查上传图片是否超过了4M
10313 invalid app_id appid不合法检查appid是否正确
10909 IFREAD_WRAPPER_ERR_RUNTIME
非法数据接口执行错误 1. 检查参数设置是否正确，图片格式是否符合要求

手指检测失败，调整手指摆放问题
ocr识别失败，确认所指区域是否有文字以及文字是否清晰
调用示例
注: demo只是一个简单的调用示例，不适合直接放在复杂多变的生产环境使用

指尖文字识别demo python3语言

指尖文字识别demo java语言

指尖文字识别demo nodejs语言

指尖文字识别demo php语言

注：其他开发语言请参照接口调用流程进行开发，也欢迎热心的开发者到讯飞开放平台社区分享你们的demo。

图片样例

指尖文字识别图片样例 JPG文件

指尖文字识别图片样例 BMP文件

指尖文字识别图片样例 PNG文件

常见问题

指尖文字识别支持什么应用平台？

答：目前支持Web API应用平台。

是否支持方向有旋转的文字？

答：支持文字与水平轴小于±15°夹角偏转。

输入图片要求？

答：图片大小4M以内，图片分辨率500W像素以上，或者500W像素图片中的部分裁剪区域，图片中文字的高度最好大于24像素，且包含不少于两个指节以上的手部区域，这样的图片识别效果会更好。