明敏 發自 凹非寺
量子位 | 公眾號
AR眼鏡字幕功能效果到底咋樣?
實測來了!
不光語音能實時轉成文字,還能分辨說話人主體,甚至還能把文字記錄都保存好,方便以后回溯。
今年,一家來自英國的一家AR初創公司,大開了個腦洞。
他們把語音轉文字的功能,搬到了AR眼鏡上,讓轉好的文字能快速直接呈現在人們眼前。
主要目的就是為了服務聽障人群。
畢竟在很多情況下,即便有助聽器的幫助,聽障人群還是需要有文字作為參考信息。
而通過AR眼鏡的方式,生成字幕能直接呈現在人們眼前,接收信息能更加方便和迅速。
具體效果如何?往下看~
?有種開彈幕的感覺
體驗的效果大概如下左圖所示,會有一個對話框,里面將標注說話者及對應語音內容。
體驗者西蒙·希利(Simon·Hill)說,在剛戴上AR眼鏡聽對方說話時,它的文字轉錄準確率非常不錯。
效果有點像平常用語音實時轉文字的功能,在語音結束前谷歌眼鏡功能大解析,文本內容會一直有調整,最后等一段話說完,才會有個最終版本。
不過在對話情景下,兩個人多聊一會,語音轉寫的速度會變慢一些。
XRAI內部人士表示,這是因為語音轉文字的計算在云端上進行,有延遲很正常。
而且不止是實時轉錄,這個功能還支持搜索歷史記錄,在AR眼鏡端和手機端都能搜,有點聊天軟件那感覺了。
錄下的語音在轉寫完成文字后,就會被立即刪除,XRAI還強調這些文本也是只有用戶自己可見。
如果沒有AR眼鏡,也能在手機上體驗XRAI的功能。
有網友也戴著眼鏡體驗了一下,表示這個功能在轉語音的速度上還是很快的,而且在AR界面里的呈現也不錯。
缺點是需要選一下要識別的語言種類,在這里她測試的是法語。
除此以外,西蒙大哥在體驗中,也發現了一些小問題。
比如按照XRAI的設想,聽障人士使用這一功能,需要一副AR眼鏡+一款安卓手機。
是的,該應用暫時還不支持iOS系統。
而兩臺設備加起來,拿著比較麻煩,尤其是在AR眼鏡重量還沒有降下來的情況下,聽障人士要戴人工耳蝸、還要戴一副AR眼鏡,舒適度肯定不高。
西蒙表示:
我無法想象如何整天帶著他們。
以及語音轉文字的效果,西蒙也提出了一點質疑。他表示,對于聽障人士來說,需要文字作為參考信息的情景,很可能是比較嘈雜的場所,這對于語音識別的算法提出一定要求。
而他在體驗XRAI這項功能時谷歌眼鏡功能大解析,公司CMO特意把他領到了比較安靜的環境演示,并坦言在嘈雜環境中的效果還不是很好。
以及在價格上,XRAI上線的AR眼鏡是Nreal,國內售價2299元起,海外售價為379美元。
XRAI的服務也并不完全免費,基礎免費版只能保存1天的對話記錄,另外還有20美元/月、50美元/月兩種套餐可以選擇。
如果選擇50美元/月的套餐,在基礎功能上還將加一個人工智能助手。
但西蒙表示,作為一個還在起步階段的產品,有缺點可以理解。
更關鍵的是,他們從無障礙的角度出發想要幫助聽障人群,這一想法還是令人感到欣慰。
背后公司XRAI Glass
提供這項服務的公司來自英國,名叫XRAI Glass。
公司CEO為丹·斯卡夫(Dan ),他曾在高知特微軟業務組( Group)擔任首席問題官。
CTO蒂姆·斯卡夫(Tim ),獲得了機器學習專業博士學位,也曾在微軟工作。
按照領英顯示,該公司在今年7月才剛剛成立。
合作的AR眼鏡廠商Nreal于2017年成立,創始人徐馳曾在Magic Leap工作過。
參考鏈接:
[1]
[2]
— 完 —
「2022人工智能年度評選」榜單揭曉
最佳產品TOP10
點這里關注我,記得標星哦~