本文以语音识别算法(中文WebSocket版本) 为例
SDK源码地址:Github
安装SDK

  1. pip install leqi-algorithm-mic-sdk

代码

  1. from algorithm_mic_sdk.auth import AuthInfo
  2. from algorithm_mic_sdk.ws.speech_recognition_chinese import SpeechRecognitionChinese
  3. host = 'ws://gateway.algo.leqi.us:8005' # 算法host地址,协议头为ws
  4. user_name = 'your name'
  5. password = 'password'
  6. filename = '1.pcm' # 音频文件名,这里采用文件的方式来模拟读取流数据,在实际场景中,这个数据可能是由客户端与服务器的socket连接句柄中读取
  7. audio_format = 'PCM' # 音频格式
  8. def callback(ws, data):
  9. # 回调函数 入参两个参数,一个是当前连接句柄,一个是识别的结果,这里只是对识别结果做简单输出
  10. print(data)
  11. # 创建一个获取流数据的迭代器,在实际场景中,这个数据可能是由客户端与服务器的socket连接句柄中读取
  12. def send_request_body(stream_filename):
  13. data = open(stream_filename, 'rb').read()
  14. while data:
  15. d, data = data[:320], data[320:]
  16. yield d
  17. # 初始化权限信息类
  18. auth_info = AuthInfo(host=host, user_name=user_name, password=password)
  19. # 创建一个识别句柄
  20. speech_recognition_chinese = SpeechRecognitionChinese(auth_info, audio_format, send_request_body(filename), callback)
  21. # 运行请求算法,执行此步骤将会发生阻塞
  22. speech_recognition_chinese.run()