酷应用

你忘掉说过的话，智能音箱它有可能全帮你记着。

百家作者：尖刀制造 2019-09-02 13:17:19

如果你的智能音箱成为了细缝里的一双眼，它躲在客厅里窥取你的一字一句，它藏在卧室角落中，听着你的鼾声，听着你的喘息。

你还会那么信任它吗？那么它到底是智能音箱还是一个智能窃听器？

一个小实验

智能音箱真的会监听我吗？之前无聊的时候我做过一个小实验，把智能音箱通过WiFi链接在一个独立的路由下，又在电源前放了一个可以计量的小电表（淘宝花了我几十块），在没有唤醒音响的情况下，在屋子里放了几个小时郭德纲相声。

测试了手里的好几个智能音箱，最终发现了一些大家都能感兴趣的事儿，我没去纠结这个智能音箱在传什么，但是通过路由器的流量以及电表的耗电量，我想我已经找到了该找的答案。

它们一直在细缝中监听我。

聊聊Echo

17年亚马逊Echo曾爆过一个漏洞，这个漏洞算鸡肋也不算鸡肋，操作者需要通过物理接触音箱，把它调整到调试模式通过外部的SD卡启动后，以root的方式把麦克风开启始终监听，最终把Echo改装成一个监听器，当然细节肯定没这么容易。

海豚攻击

人耳朵能听到的声音范围是20Hz～20000Hz，但相对敏感1000Hz～3000Hz之间，如果大于20000Hz的频率呢？

浙大之前搞过一个实验，就是通过这种人耳听不到高频超声波，向手机发送命令，最终偷偷唤醒Siri执行相应的命令，打电话给XXX，发微信给XXX，其实亚马逊Alexa、谷歌助手也一样会遭遇这种攻击。

这种攻击可以演变成埋雷攻击，比如把准备好的指令放到一个mp3或者某个文件里，所以当你触发它的时候，

这种攻击很诡异，手机会在处于静音状态的情况下，而执行指令，用户是基本很难察觉的到的，就像海豚一样，发出人类无法识别的超声波，所以这种攻击被命名为Dolphin Attack（海豚攻击）。

主动攻击

前面讲的这都还是被动作恶，其实相对也还OK，那么主动的呢？所有的智能音箱都存在多扇门，而这些门大部分都掌握在开发者手里。

推送接口

大部分的智能音箱都存在推送功能，也就是说，它接入互联网上那一刻，开发者都可以通过推送接口，远程向音箱推送并执行一些特定的命令，这些接口原则上是用于一些活动及信息推送，但是如果被恶意利用？

轻则半夜播放个鬼叫的恶作剧音乐，重则配上智能家居开开关关.....

蓝牙攻击

不得不说，作为一个搭载了WiFi模组的智能音箱，大部分还是保留了音箱该有的尊严，为其保留了蓝牙模块，

很多音箱在蓝牙授权这里，基本都是能搜索到就能握手，只要这个时候没有人占着，既然已经握手了，当然这里权限有限，如果深入利用可能就需要组合攻击。

后台监听

苹果前段时间就爆出了聘用合同工对Siri到录音定期监听的绯闻，主要监听私人医疗信息、毒品信息、甚至性行为，苹果也大方的承认，确实听了用户录音，大概只审听了1%的用户录音。

说实话这我是不信的，因为考虑耗电问题，Siri肯定不是持续监听的，但是我之前在《说没监听可以，但说实现不了不行。》关于耗电问题我就解释过，如果只是特定一个词库，用户触发这些“特定”行业词，才会唤醒监听机制，其实是可以降低到无感知的。

应用层的APP都可以做到这些，那出于系统层的Siri自己作恶呢？通过截取特定关键词开始录音，再通过WiFi环境下上传压缩录音，再到云端通过NLP识别，最终把特定信息人工来鉴定。

所以NLP处理环节之前，可能远不止只有1%用户的录音这么少。

这里还只是说出于手机设备上的智能语音助手，如果换到智能音箱的场景呢？那么显然耗电问题可能就不需要考虑在其中了。

热更新

这个就不用过多解释了吧？自动云端打补丁，如果云端下发的补丁有问题，随时都可以把这个音箱扩展成，开发者想要的样子，做不好安全的话与后门无异。

持续监听

想要一个音箱知道你在喊它，那么它就要一直拾取周围环境的声音，通过NLP处理，持续把声音转成文字，最终匹配到关键词那么就完成了唤醒任务。

这里就特别有趣，识别可以通过建立离线库的方式来本地识别，当然也可以通过接口查询的方式直接传到云端去识别。

存在本地显然是一种对隐私负责任的做法，好处是只要不存识别内容，不把这些内容传到云端，肯定相对对隐私有很好的保护，但是相对来讲不够智能。

很多厂商都习惯于通过接口去直接到云端识别，当录制用户的所有的声音，一定都是直接传给云端的，从做这样的产品设计，基本你的隐私就已经开始泄漏了。

被动唤醒，就是当你说了特定关键词的时候，音箱会和你互动，然后开始录制你的声音，识别你的需求。

但是大部分的音箱其实都具备主动唤醒机制，也就是通过设定的特定规则，或者规则都不要了，就是直接远程监听录音，只要音箱自己不傻乎乎的给你个提示音、指示灯啥的，用户基本很难发现。

技术反制

之前有个名为Project Alias的开源项目就特别有趣，它主要是针对于Google Home和亚马逊Echo两款智能音箱而设计的一个小硬件。

技术原理简单粗暴，它在音箱外面做了另外一套识别机制，把它直接放到智能音箱的麦克风上，做二次转换，平时的时候仍然通过人无法听到的“低噪音”的原理，对设备持续释放干扰的白噪音，让设备根本没办法听到额外的声音，但是如果你喊对了唤醒音箱的指令，那这时候Project Alias就会停止干扰，然后让音箱恢复正常工作。

算是在音箱面前放了一个保安，接管了音箱语音唤醒的准入条件，同时对智能音箱主动作恶进行了反制和约束。

法律延伸

智能音箱作恶其实是一个很头疼的问题，我们的人脸有肖像权，但是我们却没有声音权，所以偷拍或者使用一个人的肖像是有相关的法律是进行约束的（但偷拍大部分还是治安处罚问题不是刑事责任）

但是偷听或者模仿一个人说话，大部分都是道德问题，如果没有明确的商业利益或者证明，其实很难立案，甚至就连模仿一个人的声音以配音的方式录制音频，如果这个人不是辨识度很高的名人、或者有关联的影视作品，都很难构成侵权，唯一能靠的上的相关法律条款估计也只有人格权，很难界定的东西。

所以即便是你有技术能力发现了你的音箱在监听你，除了道德谴责，目前相关法律法规好像也不知道能怎么做。

写在最后

大数据时代，各种智能家居通过语音入口，进入了家庭，搭载上智能家居确实为我们提供了很多方便，但是各位也要小心一些所谓的智能音箱窃听的风险。

很多人喜欢把智能音箱放在客厅里、卧室里，显然如果遇到以大数据分析为名的不靠谱音箱，你的隐私、你说的话、甚至你的X生活，早就暴露在这些所谓的智能音箱之下，在云端为你演变成一个个智能标签，通过这些标签，为你画出画像。

这些画像也许会用于广告营销、也许会用在数据交易、甚至未来也会用在特定的信息窃取、定向诈骗，甚至未来的更多场景.....

被监听上传的语音内容从某种角度，厂商可能是都不会删掉的，毕竟都是优质的语料，它可以搭载上AI+NLP再通过各种新的算法模型，进行深度学习，一步步挖掘成关乎你隐私的价值数据。

越智能，越缺少信任，越暴露和侵犯隐私，记住我这句话准没错。

这篇文章是为了人民网的一个采访写的参考内容，需要了解“普通”用户观点，可以点击阅读原文访问人民网最终报道文章。