@scomper

由通话录音想到的那些事

2018.03.25

想起来研究音频设备问题源于论坛里的一个求助帖子,网友提出的问题是:如何在 iPhone 上实现电话录音?按照 iOS 的设计在 iPhone 里是做不到的,然而如果用 Mac 接听 iPhone 的电话录音就简单的多,只需要用自带的 QuickTime Player 「新建音频录制」就可以完成。

QuickTime Player 录音

使用 Mac 来接听和拨打电话,需要使用同一个 Apple ID 登录 Mac,并且在 FaceTime 的偏好设置中勾选「来自 iPhone 的呼叫」,这样当 iPhone 和 Mac 处于同一个局域网,来电时 Mac 同样会弹出提示。此时打开 QuickTime Player 新建音频录制就可以开始录音了。

这种方式录音是通过内置麦克风实现的,声音采集自电脑喇叭的外放,所以声音效果一般,听上去的感觉就是对方的声音很小,而你的对话声音很大。

那么问题来了,可不可以不通过喇叭的外放直接录制系统应用的声音呢?

使用 ScreenFlow 录音

如果安装了 ScreenFlow 或者 Snagit 这样的屏幕录制软件,实现这一点是很容易的。这些软件的录制配置里除了可以通过内置麦克风录制声音以外,都提供了另一个选项「Record Computer Audio」,勾选上这个就能录制系统应用中的声音。例如:iTunes 播放的音乐、Siri 的回答音效、FaceTime 通话、模拟器中的声音、iOS 设备 AirPlay(使用 AirServer)到 Mac 的声音等等。

以 ScreenFlow 为例,如果要录下通话内容,勾选「Record Computer Audio」开始屏幕录制即可。录制完成后,在 ScreenFlow 里可以在录制轨上右键把音频单独剥离出来(Extract Audio),当然也可以在导出时(Export)选择 AAC - Audio Only 格式保存成音频。

屏幕录制软件能录制系统的声音,都是通过其自带的虚拟声卡驱动来实现的,第一次勾选录制系统声音的选项时,软件都会提示需要安装单独的驱动。录制过程中如果打开「系统偏好设置 - 声音」的面板,可以看到多出来的声音设备,不过录制完成后这个设备就消失了。

如果没有安装 ScreenFlow、Snagit 这样的付费软件,是否也可以录制系统声音呢?

Soundflower 结合 QuickTime Player 录音

玩直播和播客的对 Soundflower 肯定都不陌生,这是一个历史悠久,而且免费的应用,作用就是在系统里安装一个虚拟声卡,从而实现内录。

通过实际测试发现,安装 Soundflower 后大部分的系统声音采集都没有问题,不过 FaceTime 的通话内录不行,让人有些遗憾。Soundflower 的安装很简单,这里就不做介绍了,下面主要介绍一下安装 Soundflower 后音频设备的配置和选择问题,也顺便搞清楚音频输入和输出的一些运用。

安装好 Soundflower 以后,系统偏好设置的声音面板里能看到新增的输入和输出设备 Soundflower (2ch),2ch 对应的是两个声道,64ch 是 64 个声道,设置和选择时可以忽略 64ch。输入指的是声音来自于那个地方,输出是指声音播放的设备。默认输入是麦克风端口,输出是耳机或者电脑的喇叭,安装 Soundflower 虚拟声卡 Soundflower (2ch) 可以同时是输入和输出设备。Soundflower (2ch) 作为输入设备时会将系统应用播放的声音作为输入源,作为输出设备时可以安静的录制。

声音的输入界面里,通过观察「输入电平」的变化可以判断是否有声音输入,判断是录制麦克风的声音还是系统应用的声音,或者两者都录制。如果要同时录制麦克风和系统应用的声音,还需要走一步,使用系统自带的「实用工具 - 音频 MIDI 设置」把多个输入设备绑定在一起。

「音频 MIDI 设置」平时用到的机会很少,可以单独设置音频设备的初始音量,并能创建「聚集设备」和「多输出设备」,第一步先调整 Soundflower (2ch) 的输入音量,都调成最大的值 1。

接下来创建聚集设备,把 Soundflower (2ch) 和 内建的麦克风绑定到一起,以便同时使用。点击左下角的 + 号「创建聚集设备」,在右侧的面板中勾选「内建麦克风」和「Soundflower (2ch)」,为了方便录制监听还可以创建一个「多输出设备」,勾选「内建输出」和「Soundflower (2ch)」。

配置好以后在声音设置面板里能看到新增的「聚集设备」和「多输出设备」,如果用 QuickTime Player 录制,点开录制按钮旁的下拉选项,就有了三种选择:

  • 聚集设备,同时录制话筒和系统声音
  • 外置麦克风,仅录制麦克风采集到的声音
  • Soundflower (2ch),仅录制来自系统应用的声音

多输出营造立体声

在「音频 MIDI 设置」里看到多输出设备时想到了一个另类的应用场景,将蓝牙音箱和系统的内置输出(喇叭或耳机)绑定,这样看片的时候是不是能有立体声的效果。添加蓝牙音箱后,在「音频 MIDI 设置」的多输出设备里把蓝牙音箱也勾选上。播放时点击菜单栏声音图标选择「多输出设备」。

实际输出效果蓝牙音箱略微有点延时,没法和笔记本的喇叭完全同步,如果同时绑定多个蓝牙音箱不知道效果如何。图示中只添加了一个小米蓝牙音箱,因为输入和输出分开所以看上去有两个小米音箱。

用 Just Press Record 录音

Mac 里的软件录音虽然专业,但是更适合教程、播客制作和直播。生活场景里录音,很多时候我们只是想用录音的方式来记录事情,避免回头遗忘。对录音质量要求并不高,反而更希望通过语音识别的方式能见诸于文本。

锤子科技当初推出「闪电胶囊」的时候,很希望 iPhone 上也有一个类似的应用,想到什么或者通话时快速的录下来,回头再整理和补充文字。找了一圈类似的应用,比较满意的有 Drafts、Just Press Record,两者的使用逻辑不一样,不过都支持语音识别转文本。Just Press Record 的定位是单纯的录音和内容识别,操作交互上能实现一键录音,如果将 Just Press Record 添加到 Apple Watch 表盘上,操作起来更方便,可以在需要的时候抬起手腕快速的启动录音。

Just Press Record 的录音方式更适合平时的快速记录模式,Apple Watch 端录制的内容会自动传输到 iPhone 端,如果启用了 iCloud 还可以在 Just Press Record for Mac 上查看录音和识别的文本。

  • 通话中如果想记录备忘,点击表盘上的 JPR 启动录音;
  • 如果想同时记录对方的录音,把 iPhone 的免提打开。

默认 Just Press Record 自动识别和转换短的录音音频,在设置中可以将 Auto transcribe 修改为 All Recordings。Just Press Record 同时保留了录音和语音识别的文本,文本内容也能修改,如果同步到 Mac 端修改起来也方便。

Just Press Record 的优势是同时保存录音的同时识别为文本,如果是单纯的录音可以选择系统自带的「语音备忘录」,如果想把语音以文本的形式记录下来,途径就更多了,系统自带的输入法里包含语音识别,第三方支持语音识别的输入法还有 GBoard、讯飞输入法。Drafts 和 Just Press Record 用的语音识别引擎都是 iOS 自带的,Google 输入法和讯飞用的则是各自的语音识别技术,识别准确率上来看,个人感觉本土的讯飞更接地气一些,Google 第二,Apple 的排在最后。

从便捷性上来看,语音和录音是挺方便的,只是在公众场合需要克服「自言自语」的羞耻问题,还有就是需要在生活中实践,毕竟键盘输入和语言组织还是不太一样。最后需要提醒的是如果要录制对方的通话,记得在录音前进行说明和告知。

Comments
Write a Comment