新聞動態(tài)
聯(lián)系我們
大連愛利斯智能裝備有限公司
聯(lián)系人�。�王椿隴 總經(jīng)理助理
聯(lián)系手機(jī):13304082001
公司熱線: 0411-87329315
Email :[email protected]
聯(lián)系地址:大連市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)淮河中路1181號
AI語音解放雙手,解放思維
相比AI的其他領(lǐng)域,語言智能產(chǎn)業(yè)與產(chǎn)品的應(yīng)用行業(yè)更顯親近和自然。手機(jī)、智能家居、育兒機(jī)器人等設(shè)備都離不開語音語言的交互應(yīng)用,隨著科技巨頭們的資本涌入,語言智能成為爭奪未來智能家居和高端信息服務(wù)市場的入口。
在分析領(lǐng)域,機(jī)器通過對人類語言文本的學(xué)習(xí)、理解獲取世界知識和常識,進(jìn)而幫助人類完成復(fù)雜問題的求解和分析預(yù)測,提供更加人性化的知識服務(wù),已是可以預(yù)期的未來。而就傳統(tǒng)行業(yè)而言,語音技術(shù)的滲入對于普通大眾來說是一件好事,它將給我們的生活帶來實(shí)質(zhì)性的改變。
智能音箱:物聯(lián)網(wǎng)新入口
說到AI語音識別和交互,你現(xiàn)在還只想到語音輸入法或者Siri這樣存在于手機(jī)里的App,那就太跟不上時代了。連蘋果自己在不久前的WWDC大會上也發(fā)布了Siri的“實(shí)體化”產(chǎn)品Homepod,這正是一款智能音箱產(chǎn)品。
問題來了:音箱能有多智能?實(shí)際上,智能音箱只是它外觀的直觀描述,它真正扮演的是智能家居的樞紐角色,是一個智能機(jī)器人管家。想象一下,有了智能音箱(假設(shè)它名字叫“小英”),以后你早上睜開眼睛的第一件事不是去拿手機(jī)看時間,而是隨意對著空氣喊一聲:“小英,幾點(diǎn)了?”從擺在桌角的智能音箱里馬上傳來自然的人聲,告訴你現(xiàn)在的時間,并且問你“現(xiàn)在要起床嗎?”得到肯定的答復(fù)后,小英自動打開了電動窗簾,讓陽光照進(jìn)房間,緊接著問了一句:“需要點(diǎn)音樂或者聽段新聞幫助清醒嗎?”你直接說出想聽的音樂、新聞的名稱或者關(guān)鍵詞,很快音箱里就響起了你要聽的東西。穿衣服的時間里,你想起有封郵件不知昨晚深夜是否已收到,“小英,給我查一下郵件�!币粫䞍�,新郵件的標(biāo)題就被讀了出來……
當(dāng)然,這是一個理想的場景,但目前AI語音識別和交互技術(shù)的現(xiàn)實(shí)水平,離這也并不遙遠(yuǎn)了。國內(nèi)外的智能音箱產(chǎn)品都已經(jīng)做到在一個普通房間大小的空間范圍內(nèi),靈敏地識別人聲;并且在有一定的環(huán)境噪音存在時,語音的識別和交互也不會受到顯著影響。
相對于與手機(jī)做語音交互而言,智能音箱的進(jìn)步就是解放了人的雙手,讓人機(jī)交互更加自然。正如阿里人工智能實(shí)驗(yàn)室負(fù)責(zé)人陳麗娟所說:“語言是人與人之間最主要的溝通方式,也應(yīng)該是人與另外一種智能進(jìn)行交流的主要方式�!�
因?yàn)榫邆湔Z音交互能力的智能音箱有成為智能家居控制中心的能力,近兩年國內(nèi)外科技巨頭紛紛推出自己的智能音箱產(chǎn)品,搶占物聯(lián)網(wǎng)的重要入口。2014年11月,亞馬遜先人一步推出智能音箱Echo占領(lǐng)市場;2016年5月,谷歌的Google Home亮相;微軟等企業(yè)也不甘寂寞。進(jìn)入2017年,中國的BAT也在加緊追趕,7月初,百度宣布收購美國語音交互技術(shù)公司KITT.AI;同一天阿里發(fā)布智能音箱“天貓精靈X1”;此前的6月底,騰訊發(fā)布了智能語音解決方案“小微”;更早的2015年,京東聯(lián)合科大訊飛推出了“叮咚音箱”。
目前亞馬遜仍以絕對優(yōu)勢領(lǐng)跑家用智能音箱市場,在全球家用智能音箱市場份額占比超過40%。但亞馬遜在這個領(lǐng)域的成功遠(yuǎn)非率先推出幾款硬件產(chǎn)品那么簡單。實(shí)際上,在2014年推出Echo后不久,亞馬遜就宣布將Alexa語音平臺開放給第三方,不但包括智能家居軟件開發(fā)人員,還包括智能家居硬件制造商。開放平臺的策略給Alexa帶來巨大的發(fā)展空間。據(jù)亞馬遜公開的數(shù)據(jù),Alexa在2014年最初發(fā)布時只有13個內(nèi)嵌的技能,而目前兼容的應(yīng)用已經(jīng)超過1.5萬個,它已成為諸多智能硬件產(chǎn)品的“標(biāo)配”:華為的智能手機(jī)、LG的家庭機(jī)器人、惠而浦的洗衣機(jī)、福特的汽車等,都搭載了Alexa平臺。Alexa成為了基于語音媒介的全新操作系統(tǒng),這是其智能音箱產(chǎn)品可以成為智能家居中心的關(guān)鍵。
伴隨著智能家居市場的高速擴(kuò)張,智能語音行業(yè)有望迎來爆發(fā)式增長。市場研究公司Tractica估計,到2021年將有4000萬家庭使用基于語音的數(shù)字助手。調(diào)研機(jī)構(gòu)Strategy Analytics指出,2016年全球智能音箱出貨量為590萬臺,預(yù)計到2022年將增長10倍,市場規(guī)模達(dá)到55億美元。
盡管目前來看,各大開發(fā)商還無法通過智能語音應(yīng)用程序直接獲利,但從亞馬遜公布的數(shù)據(jù)來看,智能音箱產(chǎn)品有助于引導(dǎo)用戶消費(fèi)需求,從而實(shí)現(xiàn)更多增值收入。
AI語音助力智能醫(yī)療
在醫(yī)院里,一位醫(yī)生一邊看X光片,一邊對著手里的麥克風(fēng)說:“核對患者及手術(shù)標(biāo)記無誤,麻醉成功后,清潔手術(shù)區(qū)域皮膚,給予靜脈預(yù)防抗生素……”語音實(shí)時轉(zhuǎn)化成文字,自動輸入進(jìn)電腦里,記錄在了患者的電子病歷上,而且基本沒有錯別字,不需要修改。
這是現(xiàn)實(shí)的場景。它發(fā)生在北京協(xié)和醫(yī)院,智能語音病歷錄入系統(tǒng)的應(yīng)用,讓平均每個醫(yī)生每天整理病例的時間從超過3小時,降低到了1小時。
開發(fā)該醫(yī)院語音技術(shù)的企業(yè)是“云知聲”。當(dāng)年進(jìn)入這個領(lǐng)域時,Siri等各種語音助手很火,但該企業(yè)的負(fù)責(zé)人認(rèn)為,“這類語音助手注定是個偽命題,一定不會成功�!痹谒麄兛磥�,AI并不是一個產(chǎn)品,而是一個賦能技術(shù),是“萬金油”,比如人臉識別和安防結(jié)合才是產(chǎn)品,如果AI沒有應(yīng)用場景,用戶是無感的�!拔覀冃枰龅�,是切入這一領(lǐng)域時,將語音助手和場景結(jié)合,使得它可以服務(wù)于各行各業(yè)。”
在他們看來,醫(yī)療領(lǐng)域同樣如此。2013年,醫(yī)院信息化還是只有WIFI,那時候談AI根本不可能。但今天,隨著深度學(xué)習(xí)、大數(shù)據(jù)的積累,語音識別的準(zhǔn)確率能做到97%-98%,即便是比較嘈雜的環(huán)境,也可以做到90%以上的識別,這樣AI與醫(yī)院信息化的結(jié)合,有了一個新的機(jī)會。
根據(jù)國家衛(wèi)計委規(guī)劃信息司透露,醫(yī)療衛(wèi)生信息化是國家信息化發(fā)展的重點(diǎn),已納入“十三五”國家網(wǎng)絡(luò)安全和信息化建設(shè)重點(diǎn),將實(shí)現(xiàn)集中突破。權(quán)威機(jī)構(gòu)預(yù)測,未來幾年,我國醫(yī)療信息化規(guī)模將持續(xù)增長,國內(nèi)目前三級醫(yī)院 1400 家,二級醫(yī)院 8000 家,一級醫(yī)院接近 1.4 萬家;在理想狀態(tài)下的 10 年后,三級醫(yī)院每年至少拿出收入的 3% 用于信息化建設(shè),二級和一級醫(yī)院拿出 1.5% 進(jìn)行信息化建設(shè),屆時醫(yī)療信息化的市場規(guī)模將超過 800 億元。
有應(yīng)用場景,也有市場需求,這就可以理解為何許多AI公司都在布局醫(yī)療行業(yè)的語音技術(shù)。其中包括國內(nèi)該領(lǐng)域的領(lǐng)頭羊科大訊飛。
其實(shí)科大訊飛很早之前就已開始試水醫(yī)療,2014年8月,他們針對語音技術(shù)在醫(yī)療方面的應(yīng)用開展了研究,并在部分醫(yī)院進(jìn)行了試點(diǎn),其產(chǎn)品是把語音記錄自動轉(zhuǎn)換為文字,生成電子病歷,但一直未大規(guī)模使用。
2015 年,科大訊飛開展三大醫(yī)療業(yè)務(wù)戰(zhàn)略,其中就包括語音醫(yī)療解決方案。在這部分產(chǎn)品線上,科大訊飛的初衷是通過智能語音交互技術(shù)對醫(yī)院臨床業(yè)務(wù)進(jìn)行流程再造,減輕醫(yī)生的文書壓力,提高醫(yī)生工作效率。
2016 年,科大訊飛智慧醫(yī)療業(yè)務(wù)的“云醫(yī)聲”手機(jī)應(yīng)用在安徽省立醫(yī)院正式投入使用。云醫(yī)聲不僅能夠收集病人的資料,方便醫(yī)生隨時查閱,還能將醫(yī)生說用自然語言說出的醫(yī)囑直接記錄整理成電子文檔,同時還可給醫(yī)生精準(zhǔn)推送醫(yī)療文獻(xiàn)等數(shù)據(jù)。
考慮到放射科、牙科醫(yī)生、手術(shù)操作醫(yī)師在工作或手術(shù)中無法用手來書寫病歷,科大訊飛還為醫(yī)生特制了一款麥克風(fēng)應(yīng)對嘈雜的環(huán)境和遠(yuǎn)場識別,醫(yī)生和患者交流的過程中,算法會自動過濾掉無用的信息,將有用的醫(yī)療語音數(shù)據(jù)自動轉(zhuǎn)換成文字。
這套解決方案還能將轉(zhuǎn)換成的文字進(jìn)行結(jié)構(gòu)化處理,輸出結(jié)構(gòu)化電子病歷。病例中包含有患者的病史、檢查史、各項檢查結(jié)果、身體指標(biāo),醫(yī)生只需對電子病歷內(nèi)容進(jìn)行簡單修改確認(rèn),即可完成電子檔保存。
拓展與挑戰(zhàn)
AI語音除了以上領(lǐng)域,還有不少可以應(yīng)用的場景。
例如,在智能安全領(lǐng)域,AI企業(yè)跟國家網(wǎng)信辦和公安部門進(jìn)行合作,通過語音技術(shù)識別政治言論、暴力、恐怖和詐騙等有害信息。比如在詐騙電話中,聲音的特征和規(guī)則都是固定的,通過語音檢索技術(shù),可以判斷電話通話的聲音是否為詐騙音。
智能教育方面,AI企業(yè)可以提供語音測評服務(wù),包括中小學(xué)生的古詩詞誦讀測評和英語測評,能夠?qū)W(xué)生的發(fā)音和韻律通過與標(biāo)準(zhǔn)音比對,來幫助其提升發(fā)音準(zhǔn)確度。
在泛娛樂行業(yè)中,比如在直播中,主播說一些特定關(guān)鍵詞命令,通過語音識別就可以在平臺上自動產(chǎn)生一些交互效果,從而增強(qiáng)娛樂性和用戶黏性。這也通常和機(jī)器視覺技術(shù)一起使用,識別主播的特定動作和手勢,產(chǎn)生動畫特效。這套解決方案,直播平臺、經(jīng)紀(jì)公司和網(wǎng)紅主播都可以使用。
但是,AI語音也面臨一些挑戰(zhàn)。以當(dāng)下正在風(fēng)口的智能音箱為例,互聯(lián)網(wǎng)專家、DCCI互聯(lián)網(wǎng)研討院院長劉興亮分析,國內(nèi)的智能家電還沒有那么普及,消費(fèi)者也還沒有將一般家電更換為智能家電的剛需,大多數(shù)我國家庭對音箱的音質(zhì)好壞、是否聯(lián)網(wǎng)并沒有強(qiáng)烈的要求。這或許將讓智能音箱在我國成為一個“偽痛點(diǎn)”“偽需求”。
分析人士也指出,在國外風(fēng)生水起的智能音箱,在國內(nèi)市場面臨本土化的問題。首先,漢語因?yàn)榉窖圆町惖纫蛩�,語音識別和語義交互以及對話式交互技術(shù)比英語要復(fù)雜得多,遠(yuǎn)未成熟,設(shè)備提供的交互體驗(yàn)距離真正無障礙的人際交互還有距離,這將影響用戶體驗(yàn)。
其次,智能音箱的“核心價值”沒有標(biāo)準(zhǔn)化,用戶不知道究竟該為好的音質(zhì)買單還是為智能買單;再者,國內(nèi)企業(yè)缺乏像亞馬遜、谷歌那樣跨越多個垂直領(lǐng)域進(jìn)行資源整合的能力;此外,類似亞馬遜對Echo的補(bǔ)貼經(jīng)營策略,對于要求利潤的制造商來說很難實(shí)現(xiàn)。
許多較為成功的國內(nèi)AI企業(yè)負(fù)責(zé)人都認(rèn)同的是,AI是一種非�;A(chǔ)的資源,對各個行業(yè)來說都是賦能的,企業(yè)把相對成熟的技術(shù)去引入相對成熟的領(lǐng)域,順勢而為,才能成功。AI作為底層技術(shù),必須搭載服務(wù)和應(yīng)用,考驗(yàn)的是資源整合能力。因此,只做音箱硬件,顯然無法真正推廣AI語音;但要做到亞馬遜Alexa這樣的整合程度,讓大量的AI語音設(shè)備都愿意接入統(tǒng)一的平臺,國內(nèi)的BAT,乃至京東、喜馬拉雅雖然都在嘗試,但它們之間真的能互相打通,成為健康的生態(tài)平臺嗎?想一想這些巨頭之間互掐的歷史,就知道這有多么不容易。阻礙AI發(fā)展的,往往并不是技術(shù)本身。
聯(lián)系手機(jī):13304082001 公司熱線: 0411-87329315 網(wǎng)站備案/許可證號遼ICP備13006033號-2
聯(lián)系人: 王森觀 總經(jīng)理助理 Email:[email protected] 聯(lián)系地址:大連市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)淮河中路1173號