本文來自微信公眾號(hào):IT時(shí)報(bào)(ID:vittimes)
“外賣App到底有沒有在偷聽?”
3月18日,我們發(fā)布的《隔屏有耳,記者耗時(shí)3個(gè)月測試,美團(tuán)餓了么是否在“偷聽”?》引發(fā)熱議。更多人提到,除了外賣App,電商類、資訊類、音樂類等App都曾出現(xiàn)疑似“偷聽”現(xiàn)象,其中,生態(tài)圈模式最為完整的阿里系被吐槽最多。
但也有網(wǎng)友提出質(zhì)疑,認(rèn)為在線“偷聽”的數(shù)據(jù)量過大,App和手機(jī)都無法承受如此巨大的計(jì)算量,“巧合”很可能是基于現(xiàn)在互聯(lián)網(wǎng)公司強(qiáng)大的大數(shù)據(jù)計(jì)算和推薦。
來自云計(jì)算、語音識(shí)別、白帽子等多個(gè)渠道的專業(yè)人士向IT時(shí)報(bào)記者證實(shí),通過授權(quán)的麥克風(fēng)“監(jiān)聽”,并不需要太高的技術(shù)門檻,甚至在無網(wǎng)絡(luò)的情況下都可以實(shí)現(xiàn)語音輸入,也無需實(shí)時(shí)上傳,只要觸發(fā)某個(gè)關(guān)鍵詞后,再提取文本并發(fā)送云端即可。
澎湃新聞的一篇報(bào)道中甚至提到,有技術(shù)團(tuán)隊(duì)僅用了不到5個(gè)小時(shí),便在技術(shù)層面實(shí)現(xiàn)了App鎖屏?xí)r在后臺(tái)仍可以“監(jiān)聽”用戶講話內(nèi)容。
疑問一:數(shù)據(jù)大成本高,吃力不討好?
專家答:不存在大數(shù)據(jù)量
3月21日,澎湃新聞在《團(tuán)隊(duì)自編程序證實(shí)手機(jī)能偷聽,安全專家:未發(fā)現(xiàn)“偷聽”鐵證》一文中展示了網(wǎng)絡(luò)尖刀創(chuàng)始人曲子龍和他的人工智能團(tuán)隊(duì)進(jìn)行的一場測試,僅用了不到5個(gè)小時(shí),通過程序員編寫示例代碼,模擬打造一款手機(jī)軟件,安裝在一部安卓系統(tǒng)手機(jī)中,再設(shè)置為允許該模擬軟件使用手機(jī)錄音權(quán)限,然后將手機(jī)屏幕鎖屏。
結(jié)果,該款模擬手機(jī)軟件成功獲取了曲子龍團(tuán)隊(duì)的講話內(nèi)容,并傳輸給后臺(tái)服務(wù)器轉(zhuǎn)化成文字信息。
簡單來說,就是曲子龍團(tuán)隊(duì)從技術(shù)層面實(shí)現(xiàn)了App鎖屏?xí)r在后臺(tái)仍可以“監(jiān)聽”用戶講話內(nèi)容。
也有網(wǎng)友質(zhì)疑,語音數(shù)據(jù)量巨大,能耗高,“偷聽”用戶的成本太大,這降低了App“偷聽”用戶的可能性。對(duì)此,曲子龍?jiān)谝曨l中表示,可以把需要觸發(fā)的詞做個(gè)庫留在App上,用戶講話內(nèi)容一旦觸發(fā)特定的詞,便會(huì)喚醒這個(gè)應(yīng)用開始監(jiān)聽及分析,以此降低能耗。
國內(nèi)知名白帽子公司KEEN GeekPwn實(shí)驗(yàn)室宋宇昊認(rèn)為,APP完全可以將麥克風(fēng)聽到的語音在上傳之前先轉(zhuǎn)換成文字,這已經(jīng)是很成熟的技術(shù)。然后通過在文本里提取關(guān)鍵詞發(fā)送云端,在云端分析文本特征,并和用戶身份關(guān)聯(lián),給你精準(zhǔn)畫像,在大數(shù)據(jù)時(shí)代,這些技術(shù)都是相當(dāng)成熟的。實(shí)際上,通過App語音輸入的方式,在本地將語音轉(zhuǎn)換成文字,上傳的只是幾個(gè)標(biāo)簽,完全不存在大數(shù)據(jù)量的問題。
“將一個(gè)人一天講的話處理成文本,也只有幾頁紙。如果采用關(guān)鍵詞喚醒,數(shù)據(jù)量還會(huì)大大降低。將語音處理成文本的技術(shù)并不高級(jí),現(xiàn)在很多輸入法都能做到。”貴陽大數(shù)據(jù)交易所執(zhí)行總裁王叁壽也持同樣看法。
不過,宋宇昊也強(qiáng)調(diào),盡管技術(shù)上是可以做到的,但從目前觀察來看,無法對(duì)App是否“偷聽”做出結(jié)論。
未來技術(shù)的發(fā)展將進(jìn)一步降低“偷聽”的成本。
事實(shí)上,早在20世紀(jì)90年代,用于離線語音輸入的PC客戶端軟件就已經(jīng)出現(xiàn)。宋宇昊指出,隨著近些年人工智能的發(fā)展,這一技術(shù)已經(jīng)非常成熟,可以不依賴網(wǎng)絡(luò)在手機(jī)中流暢地輸入,甚至,一些語音輸入的App可以在手機(jī)離線無網(wǎng)絡(luò)的情況下實(shí)現(xiàn)語音輸入。
“1分鐘的音頻,只有100ms(毫秒)的延遲?!笨拼笥嶏w的技術(shù)專家說道。按現(xiàn)在的網(wǎng)速和機(jī)器性能,以上的操作可以認(rèn)為是實(shí)時(shí)完成的。
同時(shí),隨著邊緣計(jì)算越來越成熟,“偷聽”的成本還將大大降低。
一位大數(shù)據(jù)技術(shù)專家向IT時(shí)報(bào)記者闡釋,邊緣計(jì)算可以解決傳輸成本、存儲(chǔ)成本及云端搜索等問題,但技術(shù)難點(diǎn)在于離線計(jì)算的準(zhǔn)確率。
這并非憑空猜測。據(jù)上述專家介紹,在車險(xiǎn)行業(yè),車險(xiǎn)服務(wù)商已經(jīng)推出基于駕駛行為的保險(xiǎn),通過內(nèi)置攝像頭的行車記錄儀和邊緣計(jì)算+面部圖像識(shí)別技術(shù),系統(tǒng)能夠捕捉駕駛員打哈欠、閉眼、打電話、抽煙等異常動(dòng)作,這些數(shù)據(jù)都將用來做車險(xiǎn)的風(fēng)控模型,比如保險(xiǎn)人的保費(fèi)測算,而數(shù)據(jù)源是車內(nèi)攝像頭拍下的視頻,通過邊緣計(jì)算,可以大大降低數(shù)據(jù)上傳量。
近兩年,AI手機(jī)概念漸成主流,隨著手機(jī)的算力越來越強(qiáng),計(jì)算都邊緣化了,不需要云端計(jì)算的過多參與,那么,“偷聽”這種技術(shù)成本就越來越低了,而且這個(gè)未來并不遙遠(yuǎn),“在現(xiàn)在的終端成本上再增加1000元左右,就能支持邊緣計(jì)算?!币晃患夹g(shù)專家對(duì)IT時(shí)報(bào)記者展望。
疑問二:沒開權(quán)限,如何“偷聽”?
專家答:數(shù)據(jù)共享普遍存在
“在同一生態(tài)里,底層數(shù)據(jù)庫都是共享的?!蓖跞壅f道。
3月15日,恩惠(化名)與同事們正在討論共享電單車電瓶回收的事情,10分鐘后,她打開了閑魚,卻突然看到了滿屏的電池、電瓶、逆變器以及二手電瓶車轉(zhuǎn)讓信息,此前,她從未在閑魚或淘寶上搜索過相關(guān)商品。恩惠懷疑閑魚在“偷聽”自己,可打開設(shè)置一看,閑魚、淘寶的麥克風(fēng)都是關(guān)閉狀態(tài),但阿里系A(chǔ)pp中的高德地圖麥克風(fēng)是開啟狀態(tài)。
為了進(jìn)一步測試是否巧合,恩惠和同事們開始討論AirPods,過了一會(huì),刷新后的閑魚首頁變了,二手AirPods開始出現(xiàn)在推薦位?!凹?xì)思極恐”的恩惠關(guān)掉了高德地圖等所有阿里系A(chǔ)pp的麥克風(fēng)權(quán)限。
上海市軟件評(píng)測中心的工程師從技術(shù)上向IT時(shí)報(bào)記者解讀了數(shù)據(jù)如何共享,一是通過爬蟲跨網(wǎng)站追蹤用戶信息,二是App之間采用同一個(gè)SDK開發(fā),或雙方開放數(shù)據(jù)接口發(fā)送數(shù)據(jù)包,實(shí)現(xiàn)共享。
也就是說,可能存在的情況是,A雖然沒有獲得用戶的麥克風(fēng)或者讀圖權(quán)限,但是完全可以通過有權(quán)限的B獲得的信息,實(shí)現(xiàn)數(shù)據(jù)共享。這一點(diǎn),從這些App的隱私協(xié)議中可見端倪。
IT時(shí)報(bào)記者在查看了近20款主流App的個(gè)人隱私協(xié)議后發(fā)現(xiàn),超過95%以上的App都會(huì)將自有用戶個(gè)人信息共享給第三方或合作伙伴。比如,淘寶網(wǎng)隱私權(quán)政策中提到,“為便于我們基于淘寶平臺(tái)賬戶向您提供產(chǎn)品和服務(wù),推薦您可能感興趣的信息,識(shí)別會(huì)員賬號(hào)異常,保護(hù)淘寶網(wǎng)關(guān)聯(lián)公司或其他用戶或公眾的人身財(cái)產(chǎn)安全免遭侵害,您的個(gè)人信息可能會(huì)與我們的關(guān)聯(lián)公司和/或其指定的服務(wù)提供商共享。”
“同時(shí),我們在使用阿里系其他App時(shí),淘寶網(wǎng)也會(huì)從關(guān)聯(lián)公司接收、匯總、分析用戶的個(gè)人信息或交易信息?!?/p>
在IT時(shí)報(bào)的另一篇報(bào)道,《到底是誰出賣了你的隱私?315晚會(huì)沒曝光大廠,我們敢!》一文中記者指出,互聯(lián)網(wǎng)巨頭們不僅在自己的生態(tài)圈里共享數(shù)據(jù),還會(huì)向生態(tài)圈外的公司分享用戶畫像,只要用一個(gè)手機(jī)設(shè)備號(hào)(IMEI碼),就可以在廣告聯(lián)盟間追蹤用戶的標(biāo)簽,用以精準(zhǔn)投放廣告等。
除了數(shù)據(jù)共享、用戶畫像服務(wù)外,還有很多公司打著大數(shù)據(jù)的幌子進(jìn)行數(shù)據(jù)交易。據(jù)IT時(shí)報(bào)記者了解,一幅包含公積金、微信余額、淘寶購物記錄、通話記錄等數(shù)據(jù)畫成的用戶畫像被“貸款超市”以50元的價(jià)格售賣,美其名曰“風(fēng)控”。另一頭,大數(shù)據(jù)公司又從廣告主那拿到了廣告費(fèi),注冊一個(gè)用戶,廣告主給10元,一次點(diǎn)擊給0.8-1元,千次展示給15元。
疑問三:說方言能防“偷聽”?
專家答:人工智能可識(shí)別20多種方言
有用戶質(zhì)疑,當(dāng)下人工智能還很“傻”,智能音箱等硬件常常無法和人自然互動(dòng),手機(jī)上的App真可以聽懂我說話嗎?
3月18日,阮女士與同事在聊天中提起菠蘿與鳳梨的區(qū)別,隨后無意打開百度App,就在首頁看見了“菠蘿和鳳梨的區(qū)別”的推送。
“打開百度就是想找找答案,可沒想到還沒搜索,App就自動(dòng)推送了答案,而此前也從未搜索過任何關(guān)于菠蘿和鳳梨的關(guān)鍵詞?!睋?jù)阮女士回憶,在與同事討論時(shí),手機(jī)并未打開手機(jī)百度App,在手機(jī)的隱私權(quán)限中也并未給百度App開放語音權(quán)限,到底百度為何如此“聰明”,她并不知道原因。
陳女士也有類似遭遇。一天在與長輩一起吃飯時(shí),聽長輩們聊起開幼兒園話題,當(dāng)天晚上,陳女士打開百度App,便看到了關(guān)于“開辦私人幼兒園”的內(nèi)容。陳女士告訴IT時(shí)報(bào)記者,當(dāng)時(shí)長輩們聊天的時(shí)候,她并沒有參與,只是在刷微博和淘寶。
目前聽懂人類說話,人工智能要經(jīng)歷語音識(shí)別和語義分析兩個(gè)階段,在語音識(shí)別階段,國內(nèi)相關(guān)公司已經(jīng)做得相當(dāng)精準(zhǔn),也就是所謂的將語音轉(zhuǎn)化為漢字,準(zhǔn)確率超過97%,拿科大訊飛來說,目前支持中、英、日、韓、俄等約10種語言的語音識(shí)別,訊飛輸入法支持23種中國方言識(shí)別。
技術(shù)難度在語義分析階段,需要系統(tǒng)根據(jù)用戶數(shù)據(jù)進(jìn)行智能分析,并進(jìn)行精準(zhǔn)的推薦,但國內(nèi)幾大人工智能公司,目前技術(shù)進(jìn)步也非???。
多位行業(yè)人士認(rèn)為,就當(dāng)前的技術(shù)水平而言,讓人工智能聽懂,提取關(guān)鍵詞并打標(biāo)簽,也就是完成語音識(shí)別的難度并不大,然后在云端完成語義分析,這已經(jīng)是成熟的技術(shù)。
企業(yè)回應(yīng)
百度:沒有能力監(jiān)聽電話
阿里:截至發(fā)稿,并無回應(yīng)
對(duì)于這些用戶提出的質(zhì)疑,百度回應(yīng)IT時(shí)報(bào)記者稱,不論蘋果系統(tǒng)還是安卓系統(tǒng),從保密用戶隱私角度出發(fā),絕對(duì)不可能為 App 開放或者設(shè)計(jì)這樣的 API 接口,百度的手機(jī)應(yīng)用沒有能力、也從來不會(huì)申請(qǐng)所謂的“通話監(jiān)聽”這一權(quán)限。
然而,盡管“通話監(jiān)聽”這個(gè)權(quán)限沒有被申請(qǐng),但對(duì)于麥克風(fēng)權(quán)限的開啟,無論安卓還是蘋果,百度都可以申請(qǐng)用戶授權(quán)。不過,百度對(duì)此解釋,只有用戶主動(dòng)開啟語音喚醒功能,才會(huì)開啟麥克風(fēng),也就是說,喊小度小度,調(diào)起搜索才能開啟麥克風(fēng)使用權(quán)限,而且當(dāng)百度App切到后臺(tái)后,麥克風(fēng)權(quán)限便會(huì)關(guān)掉。
截至20日晚八點(diǎn)記者發(fā)稿,阿里尚未回應(yīng)是否存在利用生態(tài)系統(tǒng)內(nèi)某個(gè)App的麥克風(fēng)權(quán)限獲取關(guān)鍵詞,為用戶精準(zhǔn)推送的情況。此前,餓了么曾在本報(bào)第一篇文章中回應(yīng),不存在“偷聽”,餓了么既沒有做類似的產(chǎn)品設(shè)置,也不具備相關(guān)技術(shù)條件,餓了么嚴(yán)格保護(hù)用戶隱私,任何必要的信息采集都會(huì)在取得用戶事先同意的前提下進(jìn)行,在合法合規(guī)的范圍內(nèi)使用。
記者手記
請(qǐng)你不要比“我媽還懂我”
從外賣軟件到互聯(lián)網(wǎng)生態(tài)系統(tǒng),到底這些App有沒有“偷聽”用戶,是個(gè)“羅生門”。
盡管從技術(shù)層面來看,利用現(xiàn)已成熟的技術(shù)就能簡單地從用戶的語音里抓取關(guān)鍵詞,并進(jìn)行精準(zhǔn)推送,這事并不難,但究竟App是否在偷聽,我們依然無法下論斷。
如今,互聯(lián)網(wǎng)公司大多將上傳的數(shù)據(jù)進(jìn)行加密,如果想解密,不僅成本、技術(shù)門檻高,其中也存在一定法律風(fēng)險(xiǎn),因此很難抓到“現(xiàn)行”。
但通過幾個(gè)月的持續(xù)觀察、大量的用戶統(tǒng)計(jì)、場景復(fù)現(xiàn)測試,以及大數(shù)據(jù)共享的廣告聯(lián)盟追蹤、App隱私協(xié)議探究,我們想要說明的是,無論是“偷聽”、“偷看”還是使用所謂的“大數(shù)據(jù)畫像”,都已經(jīng)在觸碰用戶隱私保護(hù)的底線,這也是為什么第一篇文章引發(fā)全網(wǎng)激烈討論的原因。
最近幾天,因?yàn)殛P(guān)掉不少權(quán)限,記者發(fā)現(xiàn),不少App似乎沒那么“懂我”了,我們不知道原因是什么,但這總是一個(gè)令人欣喜的現(xiàn)象。
因?yàn)?,比我媽還懂我,意味著,作為個(gè)體,我已經(jīng)失去自由。
本文來自微信公眾號(hào):IT時(shí)報(bào)(ID:vittimes)