天貓精靈、小度在家、小米 AI 音箱、Siri、Alexa……不僅可以用來嘮嗑,還可以用來控制家具,甚至一聲令下它們就能幫人在網(wǎng)上買買買。
Alexa | 圖源:
所以,語音助手就和私人管家一樣,只有主人能給它下命令。沒有人會希望別人偷偷摸摸用自己的語音助手的。
從識別主人的聲音,到防止惡意程序的入侵語音識別控制系統(tǒng)有什么用,開發(fā)者們已經(jīng)想盡了辦法防止語音助手被盜用。但是,防不勝防,有研究表明,語音助手還能用激光控制。
若是語音助手放在窗戶邊,對面樓上的人發(fā)條激光就能打開你家的門,還能花光你的錢。驚不驚喜,意不意外。
11 月初,日本電氣通訊大學和美國密歇根大學的研究人員表示他們發(fā)現(xiàn)語音助手的輸入端麥克風可以用激光筆甚至手電筒控制 [1]。
他們用這樣的方法開了車庫門,還把車庫里的車啟動了。這次實驗的操作距離是 70 米,而用長焦鏡頭,操作距離竟然可以延伸到 106 米。
光怎么傳遞信息給麥克風?
光線和聲音一樣,都是在空間中傳播的波。只要是波,就能傳遞能量和信息。比如說,在看戶外演唱會的時候,陽光灑在臉上,會覺得暖,低音炮轟在臉上,會覺得懵。
麥克風里面有一個膜,聲波來時會震動,然后將震動轉(zhuǎn)換成電信號。這個膜也能把光波轉(zhuǎn)換成電信號。
光可以傳遞信息,這個不難理解。舉一個極簡單的例子,韓國電影《寄生蟲》里,殺了人的父親躲到了地下室生活,地下室有一個開關(guān)能控制一層的燈。
他根據(jù)摩斯電碼開關(guān)燈,盼望在地面的兒子能讀懂他的信息。而給麥克風輸入信息的情況略為復雜,需要按照預設(shè)輸入的聲波的波形、頻率等參數(shù)模擬出光波。
研究人員還表示,這么一來,所有涉及安全的語音識別系統(tǒng)的麥克風都需要重新設(shè)計。加一層遮光解決不了問題,因為實驗用的語音助手的麥克風即使有防塵布也能被光控。
其中,密歇根大學電機工程與計算機科學副教授傅佳偉(Kevin Fu)表示,光控麥克風這件事本身太具有普適性了,這個發(fā)現(xiàn)相當于給語音應用的安防一記重擊。
他們已經(jīng)把這項發(fā)現(xiàn)告知各大公司了,包括特斯拉、福特、亞馬遜、蘋果、谷歌。這些公司表示正在積極配合解決問題。
其實語音助手的光控還不是最讓人細思恐極的。聲控本身已經(jīng)有很多可怕的情況了。
惡意指令可以藏在別的聲音里
2016 年,加州大學伯克利分校和喬治城大學的研究人員表示他們可以在白噪音里隱藏指令,讓語音助手自動變成飛行模式或者打開某個網(wǎng)頁 [2]。
去年,這個技術(shù)升級了,原班人馬表示不僅白噪音里可以隱藏指令,而且正常的音樂或者語音里面也可以隱藏指令了。
也就是說,當用戶以為自己在聽音樂的時候,有人可以通過在音樂里隱藏惡意指令來神不知鬼不覺地操縱語音助手。其中,加州大學伯克利分校的博士生 表示做這個實驗的目的就是試探一下這類操作可以變得多么隱蔽。
惡意指令可以藏在人類聽覺范圍外的頻率里。
2017 年,普林斯頓大學和浙江大學聯(lián)合研究出用人類聽覺范圍以外頻率的聲音來操縱語音識別系統(tǒng),并將這種操縱起名 (海豚音攻擊)[3]。
在語音助手的應用中,這類操作事先會把語音助手調(diào)成靜音,這樣用戶就聽不到語音助手發(fā)出的確認或者回應。隨后,伊利諾伊大學厄本那-香檳分校的研究人員還做了一次演示實驗,在 7 米開外用超聲控制語音識別系統(tǒng)。雖然海豚音攻擊沒法穿墻,但是穿過窗戶不在話下。
惡意指令還可以被偽裝成人聽不懂的聲音
2015 年,喬治城大學的研究人員出了一篇論文,專門描述了人和機器在理解語音上的差異,并寫了他們?nèi)绾卫眠@種差異制造出機器可以理解而人無法理解的語音指令,同時提出這種差異很容易被人惡意利用 [4]。
他們發(fā)的論文的標題是《可卡因面條:利用人類和機器語音識別之間的差距》,“可卡因面條”(“ ”)是這個差異的一個典型例子,谷歌的智能助理軟件 Now 可以把“ ”聽成“OK, ”。
事實上,在一種叫隨機性的東西面前,人為惡意指令本身也沒有那么可怕了。
是目前應用非常廣泛的,學界公認的完善的語音識別底層系統(tǒng)之一,它的功能是把語音轉(zhuǎn)成文字。
2018 年 1 月,加州大學伯克利分校的研究者 和 David 表示他們可以 100% 騙過 [5]。通過對原音頻作出一點小小的改變,小到 0.1% ,他們可以讓 無法識別原音頻,或者轉(zhuǎn)出一些隨機的文字。
至于是什么隨機的文字,只能說一切皆有可能,人腦洞再大也想不到的。畢竟為了應對生活本身的 drama,人們已經(jīng)耗光了自己僅存的一點想象力。
人類一思考,上帝就發(fā)笑。人總愛創(chuàng)造自以為巧奪天工的東西,而上帝總是會及時讓人意識到自己的渺小。
然而,請不要恐慌,以上的控制語音助手的實驗基本上都是在對于惡意操控來說最有利的條件下進行的,現(xiàn)實中這樣的有利條件是比較罕見的,而且目前也沒有跡象表明有壞人通過這些操控方法來干壞事。
各大科技巨頭也早就意識到了這個問題
亞馬遜表示雖然不會公開具體的安防措施,但是其一直在升級 Echo,讓它達到最安全的狀態(tài)。不公開措施是好事語音識別控制系統(tǒng)有什么用,這樣黑客會無從下手。谷歌也表示谷歌助理會過濾掉那些人耳無法識別的指令。
亞馬遜 Echo 以及谷歌助理都只聽從主人的命令,也就是說,亞馬遜 Echo 以及谷歌助理會識別出非主人的嗓音而拒絕遵從指令。
雖然現(xiàn)有技術(shù)在識別嗓音方面還存在漏洞,比如 有一堆讓嗓音相似的人來戲弄語音助手的視頻,但是現(xiàn)有技術(shù)已經(jīng)可以規(guī)避大多數(shù)風險了。
蘋果也表示蘋果智能音箱 會自行拒絕執(zhí)行一些指令,比如開門。而有些涉及隱私的指令,比如開相冊、打開某些 app 或者網(wǎng)站需要在 或者 iPad 解鎖的情況下才會執(zhí)行。
所以,人還是想一想該怎么避免被別人利用比較好,人被未來的機器人統(tǒng)治這件事還早得很,也可能永遠不會發(fā)生。
仔細看看關(guān)于人被未來的機器人統(tǒng)治的擔憂,我發(fā)現(xiàn)這些說法基本上是西方提出的。為什么?理由肯定不是機器人起源于西方科技。
猶太教、基督教信仰中有“主”的觀念,暗示等級制度,主張只有人具有靈魂。道教和佛教主張“和”,希望世間萬物和平共處,主張世間萬物皆有靈氣。
西方國家的眾多電影和電視劇《X 戰(zhàn)警》、《環(huán)太平洋》、《愛、死亡和機器人》、《超能查派》等等都在傳遞一個信息,機器人優(yōu)于人類,且更適合在未來世界生存。
而東方國家的以日本為代表的《鐵膽火車俠》、《鐵臂阿童木》、《哆啦 A 夢》甚至《奧特曼》等等都在講述人和機器人平等生活一起分享喜怒哀樂的故事(即便你不愿意承認,但是日本的確是亞洲國家中領(lǐng)先的現(xiàn)代文化輸出國)。
愛、死亡和機器人 | 圖源:
當然,西方國家還是有很多人與機器人和平共處的文化作品。但是總得來說,許多西方觀點在精神層面對機器人有復雜且矛盾的想法,有排斥、仰視、恐懼等等,一方面希望機器人成為人類的奴隸,另一方面又不愿讓機器人具有任何人性,因為懼怕機器人的人性會反過來毀滅人類。
而亞洲國家一般持有機器人與人和諧共處的觀點,現(xiàn)實中的機器人們都有自己的名字,甚至還有美麗的外表。
如果把機器人比作奴隸的話,你會發(fā)現(xiàn)歷史總是驚人地相似,18到19世紀,白人不讓黑奴信基督教,因為他們認為黑人太野蠻,沒有靈魂。
而中國從唐朝一直延續(xù)到清朝的科舉制度不論門第以考試選出士大夫。就算是農(nóng)奴也可以跨越階層,因為中國的文化本質(zhì)上認為所有的人沒有區(qū)別。
文化本身不存在優(yōu)劣之分,我只是想讓讀者思考一下人被機器人取代的擔憂的根源,并且理性地看待這個擔憂。畢竟,最大的敵人是自己。
參考文獻
[1] .With a Laser, Say They Can Hack Alexa, Home or Siri. New York Times.
[2] , et. al. Voice . .
~daw//voice-.pdf
[3] Zhang, et. al.: Voice . ..io.
[4] , et. al. : the Gap Human and .
[5] , David .Audio : on -to-Text. arXiv.
End