文字识别
- 通用文字识别
- 通用文字识别
- 手写文字识别
- 印刷文字识别
- 印刷文字识别(多语种)
- 印刷文字识别(多语种) intsig
- 图片文档还原
- 通用票证识别
- 国内通用票据识别 sinosecu
- 离线OCR
- 名片识别 intsig
- 身份证识别 intsig
- 银行卡识别 intsig
- 营业执照识别 intsig
- 增值税发票识别 intsig
- 拍照速算识别
- 公式识别
- 指尖文字识别
通用文字识别 API 文档
#接口说明
- 通用文字识别(Universal Character Recognition),基于深度神经网络模型的端到端文字识别系统,将图片中印刷或手写的文字转化为计算机可编码的文字(目前支持中文、英文)。
- 部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
通用文字识别demo java语言
通用文字识别demo python语言 - 集成通用文字识别时,需按照以下要求:
内容 | 说明 |
---|---|
传输方式 | http[s] (为提高安全性,强烈推荐https) |
请求地址 | http[s]: //api.xf-yun.com/v1/private/sf8e6aca1 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 |
请求行 | POST /v1/private/sf8e6aca1 HTTP/1.1 |
接口鉴权 | 签名机制,详情请参照下方鉴权说明 |
字符编码 | UTF-8 |
响应格式 | 统一采用JSON格式 |
开发语言 | 任意,只要可以向讯飞云服务发起HTTP请求的均可 |
适用范围 | 任意操作系统,但因不支持跨域不适用于浏览器 |
图片格式 | jpg/jpeg/png/bmp |
图片大小 | base64编码后大小不超过4M |
#鉴权说明
在调用业务接口时,请求方需要对请求进行签名,服务端通过签名来校验请求的合法性。通过在请求地址后面加上鉴权相关参数的方式,请注意影响鉴权结果的值有url、apiSecret、apiKey、date,如果调试鉴权,请务必按照示例中给的值进行调试 # 通用文字识别 intsig API 文档-多种 ## #接口说明 + 通用文字识别 intsig(Universal Character Recognition),基于深度神经网络模型的端到端文字识别系统,将图片中印刷或手写的文字转化为计算机可编码的文字。该通用文字识别接口支持语种包括:中、日、韩、英、德、法等52种语言,详细请参照语种列表。 + 部分开发语言demo如下,其他开发语言请参照文档进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
通用文字识别 intsig demo java语言
通用文字识别 intsig demo python语言 + 集成通用文字识别 intsig时,需按照以下要求:
语种列表:
Language | 语言 |
---|---|
汉语 | 汉语 |
漢語 | 繁体汉语 |
日本語 | 日语 |
한국어 | 韩语 |
English | 英语 |
Français | 法语 |
Português | 葡萄牙语 |
Deutsch | 德语 |
Italiano | 意大利语 |
Nederlands | 荷兰语 |
Svenska | 瑞典语 |
Suomi | 芬兰语 |
Dansk | 丹麦语 |
Norsk | 挪威语 |
Magyar | 匈牙利语 |
Tiếng Việt | 越南语 |
Afrikaans | 南非语 |
shqip | 阿尔巴尼亚语 |
Euskara | 巴斯克语 |
Català | 加泰罗尼亚语 |
Hrvatski | 克罗地亚语 |
Čeština | 捷克语 |
Eesti keel | 爱沙尼亚语 |
Íslenska | 冰岛语 |
Gaeilge | 爱尔兰语 |
Latine | 拉丁语 |
Latviešu | 拉脱维亚语 |
Lietuvių | 立陶宛语 |
Melayu | 马来语 |
Polski | 波兰语 |
Română | 罗马尼亚语 |
Slovenčina | 斯洛伐克语 |
Slovenščina | 斯洛文尼亚语 |
Swahili | 斯瓦希里语 |
Türkçe | 土耳其语 |
Cymraeg | 威尔士语 |
Malti | 马耳他语 |
Kreyòl | 克里奥尔语 |
Galego | 加利西亚语 |
Esperanto | 世界语 |
Filipino | 菲律宾语 |
Indonesia | 印度尼西亚语 |
Azərbaycan | 阿塞拜疆语 |
Español | 西班牙语 |
Русский | 俄语 |
български | 保加利亚语 |
Македонски | 马其顿语 |
Українська | 乌克兰语 |
Српски | 塞尔维亚 |
БССР | 白俄罗斯语 |
Ελληνικά | 希腊语 |
Հայ | 亚美尼亚语 |
常见问题-t 4M-
#通用文字识别的主要功能是什么?
答:将图片中印刷或手写的文字转化为计算机可编码的文字,目前支持中文、英文。#通用文字识别支持什么应用平台?
答:目前支持Web API应用平台。#通用文字识别对图片有什么要求吗?
答:图片格式支持jpg格式、jpeg格式、png格式、bmp格式,且需保证图像文件大小base64编码后不超过4MB。拍照速算识别 API 文档-教育
#接口说明
拍照速算识别基于深度学习的端到端识别技术,自动识别图片中的速算题并智能批改,返回标准LaTeX公式及批改结果。覆盖K12教育范围内15种题型,支持口算、竖式、方程、脱式计算等,详细请参照 速算题型 。支持的场景有印刷体、手写体、拍照场景。 该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。#接口Demo
示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
#接口要求
速算题型
No. | 题型名称 | 题型示例 |
---|---|---|
1 | 四则混合运算 | |
2 | 带题标号的四则混合运算 | |
3 | 已知结果求运算因子 | |
4 | 填写“<” “>” “=” | |
5 | 填最大数、最小数 | |
6 | 约等于估算 | |
7 | 带余除数法 | |
8 | 相邻数 | |
9 | 分数四则运算 | |
10 | 单位换算 | |
11 | 竖式加减法 | |
12 | 竖式乘除法 | |
13 | 脱式运算 | |
14 | 解方程 | |
15 | 求平方 |
#调用示例
注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用
注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
#图片样例
注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。
#视频教程
#常见问题
#拍照速算识别的主要功能是什么?
答:拍照速算识别基于深度学习的端到端识别技术,自动识别图片中的速算题并智能批改,返回标准LaTeX公式及批改结果。#拍照速算识别支持什么应用平台?
答:目前支持Web API应用平台。#拍照速算上传什么图片识别效果最佳
答:图片格式仅支持jpeg/png/bmp,图片大小≤2M 建议使用清晰的、算式规整、文字与空白占比较大的照片,效果更好。#支持的速算题型有哪些
答:四则混合运算、带题标号的四则混合运算、已知结果求运算因子、填写“<”“>”“=”、填最大数/最小数、约等于估算、带余除数法、相邻数、分数四则运算、单位换算、竖式加减法、竖式乘除法、脱式运算、解方程、求平方。#拍照速算交互次数怎么收费
答:拍照速算免费100000次/天调用,超过可在控制台申请提额公式识别 API 文档
#接口说明
公式识别是将图片(来源如扫描仪或数码相机)中的数学公式及题干,转换化为可编辑的标准LaTeX公式及文本。覆盖小学、初中、高中等多种题型,详细请参照 公式题型 。目前仅支持拍照印刷体,拍照手写体、扫描印刷体、扫描手写体等后期逐步开放,敬请期待。 该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。#接口Demo
示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
#接口要求
公式题型
No. | 题型名称 | 题型示例 |
---|---|---|
1 | 平面直角坐标系 | |
2 | 一元二次方程 | |
3 | 概率初步cz | |
4 | 函数及其图像 | |
5 | 解直角三角形 | |
6 | 平面几何 | |
7 | 投影与视图 | |
8 | 代数 | |
9 | 实数与二次根 | |
10 | 三角形 | |
11 | 相似形 | |
12 | 分式 | |
13 | 统计初步(初中) | |
14 | 圆锥曲线方程 | |
15 | 直线和圆方程 | |
16 | 直线和平面 | |
17 | 三角函数 | |
18 | 复数 | |
19 | 概率初步gz | |
20 | 函数和投影 | |
21 | 推理和证明 | |
22 | 平面向量 |
#错误码
备注:如出现下述列表中没有的错误码,可到 这里 查询。错误码 | 错误描述 | 说明 | 处理方式 |
---|---|---|---|
10029 | ITRGetResultJson Error | 服务调用失败 | 检查图片格式是否符合要求 |
10222 | received message larger than max | 上传数据超过最大限制 | 检查上传图片是否超过了4M(base64编码后超过4M) |
10313 | invalid app_id | appid不合法 | 检查appid是否正确 |
#调用示例
注: demo只是一个简单的调用示例,不适合直接放在复杂多变的生产环境使用
注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
#图片样例
注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。
#常见问题
#公式识别支持什么应用平台?
答:目前支持Web API应用平台。#公式识别上传什么图片识别效果最佳
答:图片格式仅支持jpeg/png/bmp,图片大小base64编码后≤4M 建议使用清晰的、算式规整、文字与空白占比较大的照片,效果更好。#公式识别交互次数怎么收费
答:公式识别免费500次/天调用,超过可在控制台申请提额。指尖文字识别 API 文档-手写web
#接口说明
指尖文字识别,可检测图片中指尖位置,将指尖处文字转化为计算机可编码的文字。该能力是通过HTTP API的方式给开发者提供一个通用的接口。HTTP API适用于一次性交互数据传输的AI服务场景,比如上传图片识别其中的文字等;相较于SDK,API具有轻量、跨语言的特点。另外,请注意该接口使用的HTTP API协议不支持跨域。
#接口Demo
示例demo请点击 这里 下载。
目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。
也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
#接口要求
集成指尖文字识别API时,需按照以下要求。内容 | 说明 |
---|---|
传输方式 | http[s] (为提高安全性,强烈推荐https) |
请求地址 | http[s]: //tyocr.xfyun.cn/v2/ocr 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 |
请求行 | POST /v2/ocr HTTP/1.1 |
接口鉴权 | 签名机制,详情请参照下方接口鉴权 |
字符编码 | UTF-8 |
响应格式 | 统一采用JSON格式 |
开发语言 | 任意,只要可以向讯飞云服务发起HTTP请求的均可 |
适用范围 | 任意操作系统,但因不支持跨域不适用于浏览器 |
图片属性 | 图片分辨率500W像素以上,或者500W像素图片中的部分裁剪区域,图片中文字的高度最好大于24像素,且包含不少于两个指节以上的手部区域 |
图片格式 | jpg/png/bmp |
图片大小 | 不超过4M |
文本语种 | 中英文 |
#接口调用流程
· 通过接口密钥基于hmac-sha256计算签名,将签名以及其他参数放在Http Request Header中。详见下方 鉴权认证 。· 将请求参数以及图片数据放在Http Request Body中,以POST表单的形式提交,详见下方 请求参数 。
· 向服务器端发送Http请求后,接收服务器端的返回结果。
#白名单
默认关闭IP白名单,即该服务不限制调用IP。在调用该业务接口时
- 若关闭IP白名单,接口认为IP不限,不会校验IP。
- 若打开IP白名单,则服务端会检查调用方IP是否在讯飞开放平台配置的IP白名单中,对于没有配置到白名单中的IP发来的请求,服务端会拒绝服务。
- 在 控制台-相应服务的IP白名单处编辑,保存后五分钟左右生效;
- 不同Appid的不同服务都需要分别设置IP白名单;
- IP白名单需设置为外网IP,请勿设置局域网IP;
- 如果握手阶段返回{“message”:”Your IP address is not allowed”},则表示由于IP白名单配置有误或还未生效,服务端拒绝服务。
#鉴权认证
在调用业务接口时,须对HTTP请求进行签名,服务端通过签名来识别用户并验证其合法性。#鉴权方法
错误码
备注:如出现下述列表中没有的错误码,可到 这里 查询。
错误码 错误描述 说明 处理方式
10222 received message larger than max 上传数据超过最大限制 检查上传图片是否超过了4M
10313 invalid app_id appid不合法 检查appid是否正确
10909 IFREAD_WRAPPER_ERR_RUNTIME
非法数据 接口执行错误 1. 检查参数设置是否正确,图片格式是否符合要求
指尖文字识别demo python3语言
指尖文字识别demo java语言
指尖文字识别demo nodejs语言
指尖文字识别demo php语言
注: 其他开发语言请参照 接口调用流程 进行开发,也欢迎热心的开发者到 讯飞开放平台社区 分享你们的demo。
图片样例
指尖文字识别 图片样例 JPG文件
指尖文字识别 图片样例 BMP文件
指尖文字识别 图片样例 PNG文件
注: 如果测试过程中,发现图片符合要求但却不能识别,有可能是由于图片的真实格式和文件后缀不符,请通过图片的二进制流的头文件确认图片真实格式,不符合要求需要进行格式转换。
常见问题
指尖文字识别支持什么应用平台?
答:目前支持Web API应用平台。
是否支持方向有旋转的文字?
答:支持文字与水平轴小于±15°夹角偏转。
输入图片要求?
答:图片大小4M以内,图片分辨率500W像素以上,或者500W像素图片中的部分裁剪区域,图片中文字的高度最好大于24像素,且包含不少于两个指节以上的手部区域,这样的图片识别效果会更好。