对博客平台有些失望,转语雀只当留档用了。

有的时候我们想让树莓派能够录音,以实现语音控制等功能。所以今天我们总结一下用在树莓派上使用Python录音的过程。

树莓派上自带的3.5mm接口只能作为语音输出口,不能接麦克风。所以我们需要另外购买USB声卡,某宝上5元左右就能买到,当然你还需要一个麦克风。总费用应该在20元以内。

树莓派学习手记——使用Python录音 - 学习笔记 - SegmentFault 思否 - 图1

使用arecord -l可以列出所有录音设备,一般输出如下:

  1. arecord -l

List of CAPTURE Hardware Devices
card 1: Device [USB Audio Device], device 0: USB Audio [USB Audio]
Subdevices: 1/1
Subdevice #0: subdevice #0

同样地,aplay -l可以列出所有播放设备,输出中也能找到形如 Device [USB Audio Device] 的设备。

我们可以直接在命令行执行Linux自带的录音/播放命令,测试硬件是否正常:

  1. arecord -D hw:1,0 -t wav -c 1 -r 44100 -f S16_LE test.wav
  2. aplay -D hw:0,0 test.wav

arecord 是录音命令,其中 hw:1,0 表示 card 1: Device [USB Audio Device], device 0: USB Audio [USB Audio]card 1 , device 0 ,如果你的USB声卡录音设备不是 card 1 , device 0 ,还请进行相应修改。另外,录音过程需要手动按CTRL + C结束。

aplay 是播放命令,其中 hw:0,0 表示树莓派板载音频接口,如果你把耳机插在USB声卡接口,还请进行相应修改,如改成 hw:1,0

*如果你发现录制的音频内没有声音,只有细微的杂音,但 arecord -laplay -l 列出的设备中确实有USB声卡。那么你可以尝试着把麦克风接口拔出来一些,只插进去2/3,或许能够解决你的问题。笔者不是很明白其中的缘由,如果你有什么想法恳请留言告知。

在Python中执行录音命令需要pyaudio模块,直接用pip命令安装:

  1. pip install pyaudio

如果你使用pip命令下载速度很慢,或许修改pip源可以帮到你。

*如果你使用了virtualenv,一般会发现pyaudio安装失败。这种情况下你需要安装APT中的PortAudio开发头文件,然后安装PyAudio:

  1. sudo apt-get install portaudio19-dev
  2. pip install pyaudio

该例程修改自官方主页例程PyAudio

  1. import pyaudio
  2. import wave
  3. import os
  4. import sys
  5. CHUNK = 512
  6. FORMAT = pyaudio.paInt16
  7. CHANNELS = 1
  8. RATE = 44100
  9. RECORD_SECONDS = 5
  10. WAVE_OUTPUT_FILENAME = "output.wav"
  11. p = pyaudio.PyAudio()
  12. stream = p.open(format=FORMAT,
  13. channels=CHANNELS,
  14. rate=RATE,
  15. input=True,
  16. frames_per_buffer=CHUNK)
  17. print("recording...")
  18. frames = []
  19. for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
  20. data = stream.read(CHUNK)
  21. frames.append(data)
  22. print("done")
  23. stream.stop_stream()
  24. stream.close()
  25. p.terminate()
  26. wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
  27. wf.setnchannels(CHANNELS)
  28. wf.setsampwidth(p.get_sample_size(FORMAT))
  29. wf.setframerate(RATE)
  30. wf.writeframes(b''.join(frames))
  31. wf.close()

执行后会录制一段5秒的音频,输出为同目录下的output.wav文件。

  1. python3 rec.py

* 隐藏错误消息

一般情况下,在树莓派上执行上述Python代码后,你会看到非常多的ALSA报错和JACK报错:

ALSA lib confmisc.c:1281:(snd_func_refer) Unable to find definition ‘cards.bcm2835.pcm.front.0:CARD=0’

……

……

connect(2) call to /tmp/jack-1000/default/jack_0 failed (err=No such file or directory)
attempt to connect to server failed

但你会发现其实能够正常地录音。如果你不想看到这些错误消息,可以在代码中加入下述命令隐藏错误:

  1. os.close(sys.stderr.fileno())

使用Python录音很简单,你还可以在GPIO口上接入一个按钮,修改例程,实现按下按钮自动开始录音的功能。下一步的目标是把Python录音和Cloud Speech API语音识别结合起来。

感谢你阅读文章!