你忘掉说过的话,智能音箱它有可能全帮你记着。

百家 作者:尖刀制造 2019-09-02 13:17:19

如果你的智能音箱成为了细缝里的一双眼,它躲在客厅里窥取你的一字一句,它藏在卧室角落中,听着你的鼾声,听着你的喘息。


你还会那么信任它吗?那么它到底是智能音还是一个智能窃听器?


一个小实验


智能音箱真的会监听我吗?之前无聊的时候我做过一个小实验,把智能音箱通过WiFi链接在一个独立的路由下,又在电源前放了一个可以计量的小电表(淘宝花了我几十块),在没有唤醒音响的情况下,在屋子里放了几个小时郭德纲相声。


测试了手里的好几个智能音箱,最终发现了一些大家都能感兴趣的事儿,我没去纠结这个智能音箱在传什么,但是通过路由器的流量以及电表的耗电量,我想我已经找到了该找的答案。


它们一直在细缝中监听我。


聊聊Echo


17年亚马Echo曾爆过一个漏洞,这个漏洞算鸡肋也不算鸡肋,操作者需要通过物理接触音箱,把它调整到调试模式通过外部的SD卡启动后,以root的方式把麦克风开启始终监听,最终把Echo改装成一个监听器,当然细节肯定没这么容易。


海豚攻击


人耳朵能听到的声音范围是20Hz~20000Hz,但相对敏感1000Hz3000Hz之间,如果大于20000Hz的频率呢?


浙大之前搞过一个实验,就是通过这种人耳听不到高频超声波,向手机发送命令,最终偷偷唤醒Siri执行相应的命令,打电话给XXX,发微信给XXX,其实亚马逊Alexa谷歌助手也一样会遭遇这种攻击。


这种攻击可以演变成埋雷攻击,比如把准备好的指令放到一个mp3或者某个文件里,所以当你触发它的时候,


这种攻击很诡异,手机会在处于静音状态的情况下,而执行指令,用户是基本很难察觉的到的,就像海豚一样,发出人类无法识别的超声波,所以这种攻击被命名为Dolphin Attack(海豚攻击)。


主动攻击


前面讲的这都还是被动作恶,其实相对也还OK,那么主动的呢?所有的智能音箱都存在多扇门,而这些门大部分都掌握在开发者手里。


推送接口


大部分的智能音箱都存在推送功能,也就是说,它接入互联网上那一刻,开发者都可以通过推送接口,远程向音箱推送并执行一些特定的命令,这些接口原则上是用于一些活动及信息推送,但是如果被恶意利用?


轻则半夜播放个鬼叫的恶作剧音乐,重则配上智能家居开开关关.....


蓝牙攻击


不得不说,作为一个搭载了WiFi模组的智能音箱,大部分还是保留了音箱该有的尊严,为其保留了蓝牙模块,


很多音箱在蓝牙授权这里,基本都是能搜索到就能握手,只要这个时候没有人占着,既然已经握手了,当然这里权限有限,如果深入利用可能就需要组合攻击。


后台监听


苹果前段时间就爆出了聘用合同工对Siri到录音定期监听的绯闻,主要监听私人医疗信息、毒品信息、甚至性行为,苹果也大方的承认,确实听了用户录音,大概只审听了1%的用户录音。


说实话这我是不信的,因为考虑耗电问题,Siri肯定不是持续监听的,但是我之前在《说没监听可以,但说实现不了不行。》关于耗电问题我就解释过,如果只是特定一个词库,用户触发这些“特定”行业词,才会唤醒监听机制,其实是可以降低到无感知的。


应用层的APP都可以做到这些,那出于系统层的Siri自己作恶呢?通过截取特定关键词开始录音,再通过WiFi环境下上传压缩录音,再到云端通过NLP识别,最终把特定信息人工来鉴定。


所以NLP处理环节之前,可能远不止只有1%用户的录音这么少。


这里还只是说出于手机设备上的智能语音助手,如果换到智能音箱的场景呢?那么显然耗电问题可能就不需要考虑在其中了。


热更新


这个就不用过多解释了吧?自动云端打补丁,如果云端下发的补丁有问题,随时都可以把这个音箱扩展成,开发者想要的样子,做不好安全的话与后门无异。


持续监听


想要一个音箱知道你在喊它,那么它就要一直拾取周围环境的声音,通过NLP处理,持续把声音转成文字,最终匹配到关键词那么就完成了唤醒任务。


这里就特别有趣,识别可以通过建立离线库的方式来本地识别,当然也可以通过接口查询的方式直接传到云端去识别。


存在本地显然是一种对隐私负责任的做法,好处是只要不存识别内容,不把这些内容传到云端,肯定相对对隐私有很好的保护,但是相对来讲不够智能。


很多厂商都习惯于通过接口去直接到云端识别,当录制用户的所有的声音,一定都是直接传给云端的,从做这样的产品设计,基本你的隐私就已经开始泄漏了。


被动唤醒,就是当你说了特定关键词的时候,音箱会和你互动,然后开始录制你的声音,识别你的需求。


但是大部分的音箱其实都具备主动唤醒机制,也就是通过设定的特定规则,或者规则都不要了,就是直接远程监听录音,只要音箱自己不傻乎乎的给你个提示音、指示灯啥的,用户基本很难发现。


技术反制


之前有个名为Project Alias的开源项目就特别有趣,它主要是针对于Google Home和亚马逊Echo两款智能音箱而设计的一个小硬件。


技术原理简单粗暴,它在音箱外面做了另外一套识别机制,把它直接放到智能音箱的麦克风上,做二次转换,平时的时候仍然通过人无法听到的“低噪音”的原理,对设备持续释放干扰的白噪音,让设备根本没办法听到额外的声音,但是如果你喊对了唤醒音箱的指令,那这时候Project Alias就会停止干扰,然后让音箱恢复正常工作。


算是在音箱面前放了一个保安,接管了音箱语音唤醒的准入条件,同时对智能音箱主动作恶进行了反制和约束。


法律延伸


智能音箱作恶其实是一个很头疼的问题,我们的人脸有肖像权,但是我们却没有声音权,所以偷拍或者使用一个人的肖像是有相关的法律是进行约束的(但偷拍大部分还是治安处罚问题不是刑事责任)


但是偷听或者模仿一个人说话,大部分都是道德问题,如果没有明确的商业利益或者证明,其实很难立案,甚至就连模仿一个人的声音以配音的方式录制音频,如果这个人不是辨识度很高的名人、或者有关联的影视作品,都很难构成侵权,唯一能靠的上的相关法律条款估计也只有人格权,很难界定的东西。


所以即便是你有技术能力发现了你的音箱在监听你,除了道德谴责,目前相关法律法规好像也不知道能怎么做。


写在最后


大数据时代,各种智能家居通过语音入口,进入了家庭,搭载上智能家居确实为我们提供了很多方便,但是各位也要小心一些所谓的智能音箱窃听的风险。


很多人喜欢把智能音箱放在客厅里、卧室里,显然如果遇到以大数据分析为名的不靠谱音箱,你的隐私、你说的话、甚至你的X生活,早就暴露在这些所谓的智能音箱之下,在云端为你演变成一个个智能标签,通过这些标签,为你画出画像。


这些画像也许会用于广告营销、也许会用在数据交易、甚至未来也会用在特定的信息窃取、定向诈骗,甚至未来的更多场景.....


被监听上传的语音内容从某种角度,厂商可能是都不会删掉的,毕竟都是优质的语料,它可以搭载上AI+NLP再通过各种新的算法模型,进行深度学习,一步步挖掘成关乎你隐私的价值数据。


越智能,越缺少信任,越暴露和侵犯隐私,记住我这句话准没错。




这篇文章是为了人民网的一个采访写的参考内容,需要了解“普通”用户观点,可以点击阅读原文访问人民网最终报道文章。


我们正在寻找IoT安全相关的小伙伴,一起做一些有趣的事儿,欢迎各位加入我们这个有趣的民间组织,本篇文章如果其它媒体对该内容感兴趣,需通过微信与我联系授权,个人微信:timiky。


对隐私感兴趣的我推荐下面两本书:


一如既往的推荐我们的Aideep反欺诈小程序。

转发和打赏都是最好的支持

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接