每日經濟新聞 2021-03-12 14:39:02
◎越來越多科技公司也試圖用AI技術來幫助聽障者,打通聽障人群與普通人的最后一公里
◎騰訊天籟實驗室的AI降噪技術,應用于人工耳蝸,將語音清晰度和可懂度提升了40%
◎阿里達摩院將AI語音技術置入字幕機頂盒,實時同屏顯示畫面與輔助性字幕
每經記者 劉玲 每經編輯 文多
“對于聽障者來說,人生這張試卷,不管怎么填,都交不出滿分答卷。”
2019年12月17日,千秋(化名)在豆瓣的文章中寫下了這句話。她是一個聽障者,在七歲那年的一場高燒后失去了聽力。失去聽力的她,猶如從地面墜入了“深海”。
千秋告訴《每日經濟新聞》記者,七歲之前,她以很好的成績進入了市里最好的小學;而七歲之后,她成為了班里的隱形人。本可以在人生試卷上取得不錯成績的她,卻因為聽力這個無法逾越的障礙,讓“可能”變成了“奢望”。
像千秋這樣的聽力殘疾患者,全球約有四五億人,超過全世界人口的5%。隨著科技的發展,以及語音學、電生理學、耳顯微外科學等學科的發展,助聽器和人工耳蝸逐漸廣泛應用于臨床,成為了聽障者從“深海”上岸的救生圈。
不過,聽障者現階段的助聽設備能力有限。例如在機場、商場等比較嘈雜的公共環境中,人工耳蝸依然面臨著“聽不清”的困擾;植入人工耳蝸的聽障者仍然無法聽到音樂……他們無法獲得像普通人一樣的聽覺感受。
在AI技術迅猛發展的當下,越來越多科技公司也試圖用AI技術來幫助聽障者,打通聽障人群與普通人的最后一公里。
例如騰訊天籟實驗室的AI降噪技術,應用于人工耳蝸,將語音清晰度和可懂度提升了40%;阿里達摩院將AI語音技術置入字幕機頂盒,實時同屏顯示畫面與輔助性字幕;小米聯合科大訊飛推出“小米聞聲”的聽力輔助工具等等。
圖片來源:攝圖網(創意圖,圖中人物與新聞所述內容無關)
據世界衛生組織官網最新數據,全球大約有4.66億人患有殘疾性聽力損失,其中兒童約為3400萬。4.66億人是什么概念?這個數字比美國人口總數還多,幾乎超過全世界人口的5%。并且,預計到2050年殘疾性聽力損失人數將達到9億。
而中國,是世界上聽力殘疾人數最多的國家。據第二次全國殘疾人抽樣調查結果顯示,我國有聽力殘疾患者2780萬人,每年新增聽力殘疾人逾30萬;患聽力障礙人士共達3480萬人,居目前我國五大類的殘疾人群之首。
在新生兒方面,據《中國出生缺陷防治報告(2012)》數據顯示,中國0~6歲的兒童有超過80萬人耳聾,每年約有3.5萬先天性聾兒出生,位居我國出生缺陷前列。先天失聰,意味著學會說話都很難。
在千秋看來,自己還是有些幸運的。她戲謔道:“所幸在失聰前,我學了一口塑料川普,不至于陷入沒話可說的境地。”
但是,能說話并不代表能溝通。大部分后天失聰患者會因為聽力問題影響到語言的學習能力,分不清吐字發音的區別,使得口語表達不良,久而久之就形成了語言障礙。
英國臨床生理學家協會注冊聽力學家、英國人工耳蝸協會會員李國平向《每日經濟新聞》記者表示,聽力有障礙的孩子,往往有多重的困難癥,包括孤獨癥、學習困難癥等,這有一部分是基因造成,另外一部分是未明原因,可能是環境,也可能是其他原因,還在研究。
不僅如此,聽障者在逐漸失去語言能力的同時,似乎也失去了對生活選擇的權利。小學畢業后,千秋被送進了特殊教育學校,那家特殊教育學校的教學水平不但跟主流學校相差甚大,給予的學習方向也很少。聽障者要么學美術,大學考定點招生的學校;要么參加學校的舞蹈團,等著哪一天被北京殘疾人舞蹈團選上。
千秋說,畢業后發現每場殘疾人招聘會出現的工作大多是技工與服務員;找工作因為聽力問題屢次被刷……千秋的這些遭遇,只是幾千萬聽障人群的縮影。
“深海”之下的他們,很難觸及普通人的工作和生活。
圖片來源:騰訊提供
聽障人士為什么聽不見聲音呢?這是因為耳朵要聽到聲音,需要借助內耳耳蝸中的毛細胞進行聲——電轉化。在我們耳蝸內,有3千多個內毛細胞,以及1萬多個外毛細胞,它們在整個聽覺系統中發揮著重要作用。沒有它們,聲音就無法順利傳遞,我們也就無法聽到聲音。
雖然聽毛細胞數量眾多,但是它們卻十分脆弱且珍貴,耳蝸內毛細胞屬于不可再生的永久性細胞。當內耳毛細胞越來越少,聽力就會越來越差,直至完全聽不到。毛細胞無法再生,也就意味著聽力損失也是不可逆的。
隨著科學技術的發展,人工耳蝸和助聽器這兩種聽力輔助設備逐漸廣泛應用于臨床。其中,助聽器在聽力大約損失60分貝左右效果最好;聽力損失在90分貝以上感音性耳聾一般是用人工耳蝸植入,但是費用較高。
人工耳蝸輔助聽力的原理,是用電子耳蝸代替內耳的毛細胞,起到聲——電轉化的作用。通過體外的言語處理器收集聲音,體內的處理器進行編碼處理,轉化為電信號,再通過電極刺激聽神經,繼續后續的聲音處理過程。
18歲那年(2011年),千秋的父母帶她去做了人工耳蝸植入手術,花費了二十多萬元。無聲的狀態下生活了11年的千秋,在人工耳蝸開機的瞬間,聽見了外界涌入的各種聲音。聽得見了,但卻聽不懂了。因為聽力問題影響到了她的語言學習能力,還需要進一步做康復訓練。
人工耳蝸由于技術門檻高,研發周期長,長期以來被澳大利亞Cochlear公司、美國Advanced Bionics公司和奧地利MED-EL公司占據著國內超過90%的市場份額。千秋當時植入的人工耳蝸,便是奧地利MED-EL公司的產品。
彼時的中國,人工耳蝸行業才剛起步不久。剛好是在2011年,目前國內最大的人工耳蝸廠商之一——諾爾康電子神經科技有限公司(以下簡稱諾爾康),剛獲得國家頒發的言語處理器注冊證、植入體注冊證書,才得以打破國外三巨頭壟斷的局面。目前,諾爾康與丹麥Oticon集團合計占據全球人工耳蝸5%的市場份額。
“現在人工耳蝸技術和助聽器技術基本上已經把聽障的范圍極大縮小……人工耳蝸技術把從出生就在無聲世界里的孩子們都搶救了過來。在聽力方面,植入了人工耳蝸的孩子,很多和正常人差不多。”中國聽力語言康復研究中心專家、《中國聽力語言康復科學雜志》總編于麗玫告訴記者。
不過,于麗玫表示,雖然借助人工耳蝸和助聽器的幫助,聽障人士的交流不存在問題,但是和正常人還存在著“最后一公里”的差距。
于麗玫解釋稱,比如在嘈雜的公共環境中,人工耳蝸還面臨著“聽不清”的困擾;還有就是,人工耳蝸和助聽器提供的是言語頻率范圍內的聲音增進,并不是所有的頻率都能涉及。聽障者只能聽到語言頻率范圍的聲音,還不能夠欣賞音樂,不能辨別高低音等等。
諾爾康總經理李楚曾給記者打過一個比方:目前全球人工耳蝸中電極數最多的有24個,耳蝸是蝸牛的形狀,上面是低頻,下面是高頻,攤開就是一個鋼琴鍵盤,正常人有3千個鍵盤,而人工耳蝸只有有24個,所以人工耳蝸“彈”出來的聲音和正常耳朵聽到的聲音有很大的區別。
圖片來源:攝圖網
2019年初,任職杜比工程團隊高級總監9年的商世東,加入了騰訊擔任多媒體實驗室音頻技術中心高級總監,而后擔任天籟實驗室負責人。騰訊天籟實驗室針對語音在嘈雜環境中的情況,把經典信號處理和機器學習技術融合在一起,加上聲學場景分析技術,打造了一套降噪解決方案,并把技術應用在包括騰訊會議等多個產品里。
商世東告訴《每日經濟新聞》記者,因為騰訊天籟實驗室主要從事聲音方面的研究,所以在做聲音相關技術開發的時候,實驗室會和騰訊內部多個無障礙項目做一些溝通和合作。“在這個過程中,我們接觸到了聽力障礙的人群,感受到了他們對聲音的渴望。”
商世東和團隊討論了很多次,“我們應該為他們做點什么?”“AI能為他們做點什么?”
針對人工耳蝸的用戶痛點,商世東和團隊展開了深入調研,他們發現,“當電腦、手機可以達到主頻是G赫茲的多核架構的時候,人工耳蝸由于尺寸限制,卻往往只有幾十兆赫茲的處理能力。在這樣的局限條件下,高復雜度的噪聲處理成為了業界的一個難點”。
于是,通過與諾爾康一起討論在當前人工耳蝸軟硬件條件局限下的解決方案,并經過長達半年的技術驗證后,商世東和團隊從架構上最終確定了“手機伴侶+人工耳蝸”的聯合解決方案。
因為AI降噪的計算功耗要求比較高,還包括一些健康的約束,比如說佩戴的這些設備如果功耗過高的話,可能會影響健康。“所以功耗不能特別大,一些高復雜的計算模塊是以手機伴侶APP的形式呈現。”騰訊天籟實驗室專家肖瑋向記者解釋道。
諾爾康實驗檢測數據顯示,天籟技術與人工耳蝸結合后,人工耳蝸的語音清晰度和可懂度提升了40%,語音平均識別率達到96.28%。經過AI降噪技術提升后的信號,傳遞到人工耳蝸后,極大改善了聽障人士的聽覺體驗,讓聽障人士在“聽得見”的基礎上“聽得清、聽得真”。
實際上,除了騰訊天籟實驗室,許多知名的互聯網公司也在探索AI幫助聽障人士的應用場景。
例如,阿里巴巴達摩院將AI語音技術置入字幕機頂盒,連接有線電視、電腦或手機后,便可以實時同屏顯示畫面與輔助性字幕,讓聽障群體得以無障礙收看春晚、新聞等直播節目。2020年春節前夕,字幕機頂盒入駐了全國上百個聾人家庭及社區。
微軟推出的Microsoft Translator也是如此,能夠將老師的口語轉化為實時字幕,還能將翻譯的文字結果保存在手機中,幫助學生們輕松學習;小米和“訊飛聽見”合作打造的一款“小米聞聲”的聽力輔助工具,能夠在相機錄制有聲視頻自動生成字幕;騰訊優圖實驗室發布的“優圖AI手語翻譯機”,能快速把手語轉換為文字……
騰訊天籟實驗室專家肖瑋向《每日經濟新聞》記者解釋到,言語的頻率范圍大概是300Hz~3.4kHz,人類能感受聲音范圍約為20Hz~20kHz,人工耳蝸可以響應的范圍頂多到8kHz。因為受硬件的限制,太大的頻率范圍處理的確有很大的難度。
“我們的想法是一步一步來,還是想先把言語這部分的感知做得更好一點,讓聽障者聽得更清。如果時機合適,而我們積累的一些音樂處理的技術對聽障者有幫助的話,我們愿意與聽力學界的朋友一起去突破這些難題。”肖瑋補充道。
圖片來源:攝圖網
世衛組織數據顯示,全球將近50%的12至35歲人群,即大約11億年輕人由于長時間或過度娛樂噪聲暴露,正面臨著聽力受損的風險。在老年人群中,一般來說,60歲以上的老人,40%~50%會有一定程度的聽力下降;到了70歲,占比會增加10%;到100歲左右,至少90%的人都會出現聽力下降。
“比如說在地鐵上聽耳機,一般地鐵站的聲音是80分貝左右,我們耳機的聲音需要在80分貝的基礎上上調20分貝才能聽到音樂。這樣的情況下,音樂就遠遠超出噪聲的標準,聲音一般達到90分貝以上就會使聽力受損。”于麗玫告訴《每日經濟新聞》記者。
前文中曾提到,聲音需要借助內耳耳蝸中的聽毛細胞進行聲——電轉化。于麗玫表示,人的聽毛細胞只有1萬多個,噪聲刺激損傷了毛細胞之后,它就不再生了;毛細胞數量越來越少,聽力就會越來越差。“就像我們日常生活當中看到的電燈一樣,燈里面有很多燈線,燈線都壞掉的時候,燈就滅了。”
于麗玫強調,聽力的損傷是悄無聲息的。在聽力損失剛發生時,人們在生活和社交方面只會受到輕微影響,很多人通常對自己的聽力變化并不在意,大多認為是注意力不集中或上火導致的,很多人也有“人老了聽力就應該不好”的想法。
實際上,這個時候是聽力干預的最佳時機,但此階段往往被99%的人忽視,進而導致一系列言語識別率下降等問題。
“一個人從有聽力損失到聽不見大概是十年的時間,有點像牙齒,剛開始出現問題的時候并沒有在意,只有牙疼得滿地打滾的時候才去見醫生。聽力也是,許多患者到聽不見很多年了才去見醫生。”李國平補充道。
記者了解到,長期從事聽覺、聽力學科研、教學以及臨床工作的李國平,在2016年創立了英國2Hearing公司,希望能夠以互聯網的方式解決聽力咨詢和康復環節,目前公司研發了世界首例通過電話為漢語普通話使用者檢測聽力的篩查系統。
依托2Hearing的聽力篩查系統,騰訊天籟聯合中國聽力語言康復研究中心、中國聽力醫學發展基金會等在2021年3月3日的全球愛耳日上,推出聽力損失自測小工具——線上數字測聽測試,人們足不出戶即可初步判斷自己的聽力損失程度。
《每日經濟新聞》記者在體驗了“線上數字測聽測試”小程序后了解到,該自測小工具是讓測試者在不同的噪聲水平上,感知自己的聽力狀態,每題答對后就會升級噪聲,最后將測試結果分成ABC三個檔位,來衡量不同年齡段的聽力水平。
圖片來源:手機截圖
但記者也發現,在測試結果報告的下方寫著,“數字測聽是一種高效的,自我進行聽力篩查的工具,不能代替臨床診斷結論”。對此,肖瑋向記者坦言,線上數字測聽是通過這些數據的分析,喚醒大家對聽力健康的關注。如果想進一步了解自己的聽損情況,應該去專業醫院做進一步檢查。
今年是2021年,距離千秋植入人工耳蝸已經過去了近十年。她說,大學四年,工作五年多,如果拿友誼來說,跟人工耳蝸也差不多算是生死之交了。
人工耳蝸讓千秋得以正常地聽和說,大學畢業后,她進入一家公司做新媒體運營,經過一路打怪升級,一度晉升到了新媒體主編的位置。
2019年,她決定辭職,并開啟了公益領域創業之路,先后成立了一家文化傳媒公司和一家為殘疾人社會工作服務的非盈利機構。目前,千秋正在做一個倡導聾健互融的社會創新公益項目——KNOW DEAF,她希望通過“科普倡導”、“榜樣帶動”、“成長課程”、“可持續性陪伴”等六個路徑,讓聽障人士的未來“無限大”。
雖然科技的進步,在不斷打通聽障人群與健全人群的“最后一公里”,同時也提供了更多殘障人士可以勝任的工作。但在她看來,聽障群體的困境,不只是聽力的障礙,還有內心的障礙。
千秋曾說:“對于聽障者來說,人生這張試卷,不管怎么填,都交不出滿分答卷。”但是,她希望通過這些公益項目,讓更多聽障的孩子,找到自己的光芒。
她說,“世界沒有童話,但我們可以是自己的彼得潘”。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP