亚洲永久免费/亚洲大片在线观看/91综合网/国产精品长腿丝袜第一页

每日經(jīng)濟(jì)新聞
新科技

每經(jīng)網(wǎng)首頁(yè) > 新科技 > 正文

人工智能黎明將至?繼谷歌后百度開(kāi)放四項(xiàng)語(yǔ)音技術(shù)接口

每日經(jīng)濟(jì)新聞 2016-11-23 12:02:52

作為人工智能的主要技術(shù)及應(yīng)用之一,語(yǔ)音識(shí)別是國(guó)內(nèi)外科技公司都在耕耘的方向。百度公司首席科學(xué)家吳恩達(dá)甚至形容稱(chēng),“我們已經(jīng)站在人工智能的黎明。”

每經(jīng)編輯 趙娜    

Graywatermark.thumb_head

每經(jīng)記者 趙娜

日前,百度宣布在其語(yǔ)音開(kāi)放平臺(tái)上線(xiàn)三周年之際,向公眾開(kāi)放四項(xiàng)全新語(yǔ)音技術(shù)接口,分別是情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期技術(shù)和長(zhǎng)語(yǔ)音。

《每日經(jīng)濟(jì)新聞》記者注意到,作為人工智能的主要技術(shù)及應(yīng)用之一,語(yǔ)音識(shí)別是國(guó)內(nèi)外科技公司都在耕耘的方向。百度公司首席科學(xué)家吳恩達(dá)甚至形容稱(chēng),“我們已經(jīng)站在人工智能的黎明。”

早些時(shí)候,谷歌于今年3月宣布開(kāi)放其語(yǔ)音識(shí)別API(應(yīng)用程序編程接口)。

據(jù)了解,百度語(yǔ)音開(kāi)放平臺(tái)日前宣布對(duì)外開(kāi)放的四項(xiàng)技術(shù),也可以理解為輸出解決方案,包括情感合成、遠(yuǎn)場(chǎng)方案、喚醒二期技術(shù)和長(zhǎng)語(yǔ)音四種。

“這些技術(shù)有很大的潛力,去徹底改變?nèi)藱C(jī)交互的效率和辦法。未來(lái)語(yǔ)音技術(shù)在很多應(yīng)用場(chǎng)景有很好的機(jī)會(huì),將為人機(jī)交互帶來(lái)巨大的改變。”吳恩達(dá)表示,這些技術(shù)旨在解決用戶(hù)在使用語(yǔ)音交互的場(chǎng)合時(shí),普遍感到困擾的一些關(guān)鍵問(wèn)題。例如,百度情感合成技術(shù)主要聚焦在為合成語(yǔ)音“加入情感”,目前可達(dá)到接近真人發(fā)聲效果。類(lèi)似地,開(kāi)發(fā)者還可以利用新的接口,使語(yǔ)音識(shí)別距離增加到3米到5米,將設(shè)備的語(yǔ)音喚醒率提升到95%以上,同時(shí)更省電、誤報(bào)更少,或提升長(zhǎng)時(shí)間語(yǔ)音識(shí)別的準(zhǔn)確率問(wèn)題。這將為語(yǔ)音技術(shù)帶來(lái)遠(yuǎn)比現(xiàn)在更多的想象空間,而不只是遙控電視或解鎖手機(jī)。

公開(kāi)資料顯示,百度語(yǔ)音識(shí)別準(zhǔn)確率已達(dá)97%。百度語(yǔ)音開(kāi)放平臺(tái)自2013年10月上線(xiàn)以來(lái),開(kāi)發(fā)者數(shù)量超過(guò)14萬(wàn)。

斯坦福大學(xué)人工智能專(zhuān)家James Landay提到,“近兩年,受益于大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,語(yǔ)音識(shí)別技術(shù)突飛猛進(jìn),速度及準(zhǔn)確性都有了長(zhǎng)足進(jìn)步。”

值得注意的是,作為人工智能的主要技術(shù)及應(yīng)用之一,語(yǔ)音識(shí)別是國(guó)內(nèi)外科技公司都在耕耘的方向,包括蘋(píng)果、微軟、谷歌、百度、騰訊、科大訊飛和搜狗等多家公司都在這一領(lǐng)域發(fā)力。

“我們已經(jīng)站在人工智能的黎明。”11月22日下午,吳恩達(dá)在接受包括《每日經(jīng)濟(jì)新聞》在內(nèi)的媒體采訪(fǎng)時(shí)稱(chēng),語(yǔ)音識(shí)別的門(mén)檻很高,除了技術(shù)復(fù)雜,數(shù)據(jù)門(mén)檻也非常高。現(xiàn)階段,最難的仍是核心技術(shù)研發(fā),如識(shí)別率提升、大數(shù)據(jù)語(yǔ)音合成等。百度希望通過(guò)開(kāi)放相關(guān)技術(shù),讓智能應(yīng)用更易被開(kāi)發(fā)。

另一方面,今年3月,谷歌在其N(xiāo)ext云計(jì)算大會(huì)上發(fā)布面向開(kāi)發(fā)者的新機(jī)器學(xué)習(xí)平臺(tái)的同時(shí),宣布開(kāi)放語(yǔ)音識(shí)別API,即谷歌語(yǔ)音搜索和語(yǔ)音輸入的支持技術(shù)。

記者留意到,Google Cloud SPeech API包括了80多種語(yǔ)言,適用于各種實(shí)時(shí)語(yǔ)音識(shí)別與翻譯應(yīng)用。9月下旬,外媒報(bào)道稱(chēng),谷歌宣布將收購(gòu)智能語(yǔ)音識(shí)別工具開(kāi)發(fā)商API.ai,預(yù)計(jì)會(huì)整合后者的自然語(yǔ)言理解技術(shù)。

而就在上周的第三屆世界互聯(lián)網(wǎng)大會(huì)上,王小川在演講中現(xiàn)場(chǎng)演示了實(shí)時(shí)語(yǔ)音識(shí)別和翻譯的能力,并提到,搜索的未來(lái)就是問(wèn)答機(jī)器人,隨著技術(shù)的突破,搜索引擎會(huì)自然而然演化成為問(wèn)答引擎。但他也直言,盡管人工智能最重要的突破領(lǐng)域是在語(yǔ)音和圖像領(lǐng)域,但在文字領(lǐng)域的進(jìn)展仍較緩慢。比如,在安靜的環(huán)境下,搜狗的語(yǔ)音識(shí)別準(zhǔn)確度已經(jīng)到了95%甚至97%,但一旦有噪音,準(zhǔn)確率會(huì)迅速下降。

 

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線(xiàn):4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

人工智能 語(yǔ)音識(shí)別

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0