本文以语音识别算法(中文WebSocket版本) 为例
SDK源码地址:Github
安装SDK
pip install leqi-algorithm-mic-sdk
代码
from algorithm_mic_sdk.auth import AuthInfofrom algorithm_mic_sdk.ws.speech_recognition_chinese import SpeechRecognitionChinesehost = 'ws://gateway.algo.leqi.us:8005' # 算法host地址,协议头为wsuser_name = 'your name'password = 'password'filename = '1.pcm' # 音频文件名,这里采用文件的方式来模拟读取流数据,在实际场景中,这个数据可能是由客户端与服务器的socket连接句柄中读取audio_format = 'PCM' # 音频格式def callback(ws, data):# 回调函数 入参两个参数,一个是当前连接句柄,一个是识别的结果,这里只是对识别结果做简单输出print(data)# 创建一个获取流数据的迭代器,在实际场景中,这个数据可能是由客户端与服务器的socket连接句柄中读取def send_request_body(stream_filename):data = open(stream_filename, 'rb').read()while data:d, data = data[:320], data[320:]yield d# 初始化权限信息类auth_info = AuthInfo(host=host, user_name=user_name, password=password)# 创建一个识别句柄speech_recognition_chinese = SpeechRecognitionChinese(auth_info, audio_format, send_request_body(filename), callback)# 运行请求算法,执行此步骤将会发生阻塞speech_recognition_chinese.run()
