亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經濟新聞
推薦

每經網首頁 > 推薦 > 正文

每經專訪科大訊飛輪值總裁胡郁:5G對于影音和圖像交互有機遇

每日經濟新聞 2019-06-30 23:01:59

人工智能并不遙遠,其相關應用已經不知不覺中滲透進人們的生活。

近日,由上海新滬商聯合會主辦的“第二屆長三角民企發展大會”在上海舉行。科大訊飛輪值總裁胡郁出席了本次大會,并發表了演講。在此次大會的間隙,胡郁接受了《每日經濟新聞》記者的采訪。

每經記者 冷輝    每經編輯 盧九安    

圖片來源:攝圖網

6月28日,由上海新滬商聯合會主辦的“第二屆長三角民企發展大會”在上海舉行。科大訊飛股份有限公司(以下簡稱“科大訊飛”)輪值總裁胡郁出席了本次大會,并發表了演講。在此次大會的間隙,胡郁接受了《每日經濟新聞》記者的采訪。

人工智能并不遙遠,其相關應用已經不知不覺中滲透進人們的生活。例如,在本次長三角民企發展大會現場,會實時將演講嘉賓的講話語音轉換成文字,并在大會主舞臺的屏幕上同步顯示。這是采用了科大訊飛所提供的智能語音轉寫系統“訊飛聽見”所生產的大會字幕。不過,雖然準確程度頗高,但也不乏一些專業字詞錯誤。

對此,科大訊飛輪值總裁胡郁接受《每日經濟新聞》記者采訪時表示,將從識別方言、中英文混讀、專業詞匯,以及降噪等多個方面進行優化,以期降低錯誤率。

降低錯誤率仍有多個難題要攻克

智能語音識別作為人工智能的關鍵組成部分,從軟件開發者的角度來說,如何進一步降低語音識別錯誤率?

胡郁在回答《每日經濟新聞》記者提問時表示,主要還是有幾個方面的難題需要攻克,需要研究人員來解決這些問題。一個是口音的問題,有很多人的普通話可能沒那么準,存在一些方言夾雜、口齒沒有那么清晰的情況。第二個,現場環境是不是足夠的安靜。因為現場環境有些噪聲的話,還需要用一些降噪的方法,才能夠不斷提高智能語音識別系統的性能。第三個是有一些關于中英文混讀的情況,中文和英文混雜的時候,現在處理的還不是特別好,雖然已經比以前要強很多。最后一個,就是一些專業詞匯方面,有些詞匯只有在特定的場景下,才知道它是什么意思。一些同音詞匯是很多的,也有可能會出現一些同音詞方面的問題。

胡郁提到,技術肯定是在不停地進行優化的。他舉例稱,當天大會現場看到的將語音轉換成文字同步到大屏字幕的語音轉寫系統,相比兩三年前,準確度已經提高了很多。現在像這種上屏的字幕準確率在95%以上。如果是幾年前,可能只有90%左右的水平。

除了發力語音識別這一場景下的智能應用之外,胡郁提到,科大訊飛在教育、醫療、政法、智慧城市等多個方面和場景下都有延伸和覆蓋。語音識別只是語音技術中的一個很小的點,科大訊飛現在也不僅僅做語音技術,也做人工智能的認知智能,還有很多其他方面。

人機交互將更多能通過語音實現

5G轉瞬即來,談到在5G的框架之下,如何搭構新一代的人機交互的語音技術時,胡郁表示,在5G時代有非常多的發展機會。

胡郁提到,5G的響應速度會非常快,響應速度延時現在也達到了毫秒級。這對于將來的語音、圖像的交互,是非常有機會的一個點。另外,5G會帶來內容的大爆發,例如高清視頻、游戲這些內容的爆發,也會讓人工智能在里面應用的機會增多。比如對于內容的處理,對于內容的自動剪輯,或者要給內容增加一些語音的標注,這些方面都會有新的發展機遇。

對于“萬物互聯”的構想,從簡單的在家庭中的應用來看,胡郁表示,未來萬物互聯會在家庭里面的很多設備和產品,在它們跟人的交互中間起到一個新的入口的作用。家中的家電、玩具、機器人等彼此間都能夠有連接,而且我們和它們,即人和物之間也能建立連接。人和物之間建立連接,原來是通過一些按鍵、控制面板的方式,用觸摸等操作來實現的,將來可能會越來越多地在里面用語音的方式實現,就像我們人和人之間交流一樣。胡郁認為這樣的連接會越來越普遍而廣泛。

胡郁表示,科大訊飛自身的定位是在人工智能領域的一家技術創新型公司。這需要通過一系列的品牌、市場、產品,要能夠進入到大家的生活當中去,需要時間來逐步建立大眾對科大訊飛的更多認知。

封面圖片來源:攝圖網

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

科大訊飛 5G 人工智能

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0