新聞動態
聯系我們
大連愛利斯智能裝備有限公司
聯系人 :王椿隴 總經理助理
聯系手機:13304082001
公司熱線: 0411-87329315
Email :Loong_group@yeah.net
聯系地址:大連市經濟技術開發區淮河中路1181號
AI語音解放雙手,解放思維
相比AI的其他領域,語言智能產業與產品的應用行業更顯親近和自然。手機、智能家居、育兒機器人等設備都離不開語音語言的交互應用,隨著科技巨頭們的資本涌入,語言智能成為爭奪未來智能家居和高端信息服務市場的入口。
在分析領域,機器通過對人類語言文本的學習、理解獲取世界知識和常識,進而幫助人類完成復雜問題的求解和分析預測,提供更加人性化的知識服務,已是可以預期的未來。而就傳統行業而言,語音技術的滲入對于普通大眾來說是一件好事,它將給我們的生活帶來實質性的改變。
智能音箱:物聯網新入口
說到AI語音識別和交互,你現在還只想到語音輸入法或者Siri這樣存在于手機里的App,那就太跟不上時代了。連蘋果自己在不久前的WWDC大會上也發布了Siri的“實體化”產品Homepod,這正是一款智能音箱產品。
問題來了:音箱能有多智能?實際上,智能音箱只是它外觀的直觀描述,它真正扮演的是智能家居的樞紐角色,是一個智能機器人管家。想象一下,有了智能音箱(假設它名字叫“小英”),以后你早上睜開眼睛的第一件事不是去拿手機看時間,而是隨意對著空氣喊一聲:“小英,幾點了?”從擺在桌角的智能音箱里馬上傳來自然的人聲,告訴你現在的時間,并且問你“現在要起床嗎?”得到肯定的答復后,小英自動打開了電動窗簾,讓陽光照進房間,緊接著問了一句:“需要點音樂或者聽段新聞幫助清醒嗎?”你直接說出想聽的音樂、新聞的名稱或者關鍵詞,很快音箱里就響起了你要聽的東西。穿衣服的時間里,你想起有封郵件不知昨晚深夜是否已收到,“小英,給我查一下郵件。”一會兒,新郵件的標題就被讀了出來……
當然,這是一個理想的場景,但目前AI語音識別和交互技術的現實水平,離這也并不遙遠了。國內外的智能音箱產品都已經做到在一個普通房間大小的空間范圍內,靈敏地識別人聲;并且在有一定的環境噪音存在時,語音的識別和交互也不會受到顯著影響。
相對于與手機做語音交互而言,智能音箱的進步就是解放了人的雙手,讓人機交互更加自然。正如阿里人工智能實驗室負責人陳麗娟所說:“語言是人與人之間最主要的溝通方式,也應該是人與另外一種智能進行交流的主要方式。”
因為具備語音交互能力的智能音箱有成為智能家居控制中心的能力,近兩年國內外科技巨頭紛紛推出自己的智能音箱產品,搶占物聯網的重要入口。2014年11月,亞馬遜先人一步推出智能音箱Echo占領市場;2016年5月,谷歌的Google Home亮相;微軟等企業也不甘寂寞。進入2017年,中國的BAT也在加緊追趕,7月初,百度宣布收購美國語音交互技術公司KITT.AI;同一天阿里發布智能音箱“天貓精靈X1”;此前的6月底,騰訊發布了智能語音解決方案“小微”;更早的2015年,京東聯合科大訊飛推出了“叮咚音箱”。
目前亞馬遜仍以絕對優勢領跑家用智能音箱市場,在全球家用智能音箱市場份額占比超過40%。但亞馬遜在這個領域的成功遠非率先推出幾款硬件產品那么簡單。實際上,在2014年推出Echo后不久,亞馬遜就宣布將Alexa語音平臺開放給第三方,不但包括智能家居軟件開發人員,還包括智能家居硬件制造商。開放平臺的策略給Alexa帶來巨大的發展空間。據亞馬遜公開的數據,Alexa在2014年最初發布時只有13個內嵌的技能,而目前兼容的應用已經超過1.5萬個,它已成為諸多智能硬件產品的“標配”:華為的智能手機、LG的家庭機器人、惠而浦的洗衣機、福特的汽車等,都搭載了Alexa平臺。Alexa成為了基于語音媒介的全新操作系統,這是其智能音箱產品可以成為智能家居中心的關鍵。
伴隨著智能家居市場的高速擴張,智能語音行業有望迎來爆發式增長。市場研究公司Tractica估計,到2021年將有4000萬家庭使用基于語音的數字助手。調研機構Strategy Analytics指出,2016年全球智能音箱出貨量為590萬臺,預計到2022年將增長10倍,市場規模達到55億美元。
盡管目前來看,各大開發商還無法通過智能語音應用程序直接獲利,但從亞馬遜公布的數據來看,智能音箱產品有助于引導用戶消費需求,從而實現更多增值收入。
AI語音助力智能醫療
在醫院里,一位醫生一邊看X光片,一邊對著手里的麥克風說:“核對患者及手術標記無誤,麻醉成功后,清潔手術區域皮膚,給予靜脈預防抗生素……”語音實時轉化成文字,自動輸入進電腦里,記錄在了患者的電子病歷上,而且基本沒有錯別字,不需要修改。
這是現實的場景。它發生在北京協和醫院,智能語音病歷錄入系統的應用,讓平均每個醫生每天整理病例的時間從超過3小時,降低到了1小時。
開發該醫院語音技術的企業是“云知聲”。當年進入這個領域時,Siri等各種語音助手很火,但該企業的負責人認為,“這類語音助手注定是個偽命題,一定不會成功。”在他們看來,AI并不是一個產品,而是一個賦能技術,是“萬金油”,比如人臉識別和安防結合才是產品,如果AI沒有應用場景,用戶是無感的。“我們需要做的,是切入這一領域時,將語音助手和場景結合,使得它可以服務于各行各業。”
在他們看來,醫療領域同樣如此。2013年,醫院信息化還是只有WIFI,那時候談AI根本不可能。但今天,隨著深度學習、大數據的積累,語音識別的準確率能做到97%-98%,即便是比較嘈雜的環境,也可以做到90%以上的識別,這樣AI與醫院信息化的結合,有了一個新的機會。
根據國家衛計委規劃信息司透露,醫療衛生信息化是國家信息化發展的重點,已納入“十三五”國家網絡安全和信息化建設重點,將實現集中突破。權威機構預測,未來幾年,我國醫療信息化規模將持續增長,國內目前三級醫院 1400 家,二級醫院 8000 家,一級醫院接近 1.4 萬家;在理想狀態下的 10 年后,三級醫院每年至少拿出收入的 3% 用于信息化建設,二級和一級醫院拿出 1.5% 進行信息化建設,屆時醫療信息化的市場規模將超過 800 億元。
有應用場景,也有市場需求,這就可以理解為何許多AI公司都在布局醫療行業的語音技術。其中包括國內該領域的領頭羊科大訊飛。
其實科大訊飛很早之前就已開始試水醫療,2014年8月,他們針對語音技術在醫療方面的應用開展了研究,并在部分醫院進行了試點,其產品是把語音記錄自動轉換為文字,生成電子病歷,但一直未大規模使用。
2015 年,科大訊飛開展三大醫療業務戰略,其中就包括語音醫療解決方案。在這部分產品線上,科大訊飛的初衷是通過智能語音交互技術對醫院臨床業務進行流程再造,減輕醫生的文書壓力,提高醫生工作效率。
2016 年,科大訊飛智慧醫療業務的“云醫聲”手機應用在安徽省立醫院正式投入使用。云醫聲不僅能夠收集病人的資料,方便醫生隨時查閱,還能將醫生說用自然語言說出的醫囑直接記錄整理成電子文檔,同時還可給醫生精準推送醫療文獻等數據。
考慮到放射科、牙科醫生、手術操作醫師在工作或手術中無法用手來書寫病歷,科大訊飛還為醫生特制了一款麥克風應對嘈雜的環境和遠場識別,醫生和患者交流的過程中,算法會自動過濾掉無用的信息,將有用的醫療語音數據自動轉換成文字。
這套解決方案還能將轉換成的文字進行結構化處理,輸出結構化電子病歷。病例中包含有患者的病史、檢查史、各項檢查結果、身體指標,醫生只需對電子病歷內容進行簡單修改確認,即可完成電子檔保存。
拓展與挑戰
AI語音除了以上領域,還有不少可以應用的場景。
例如,在智能安全領域,AI企業跟國家網信辦和公安部門進行合作,通過語音技術識別政治言論、暴力、恐怖和詐騙等有害信息。比如在詐騙電話中,聲音的特征和規則都是固定的,通過語音檢索技術,可以判斷電話通話的聲音是否為詐騙音。
智能教育方面,AI企業可以提供語音測評服務,包括中小學生的古詩詞誦讀測評和英語測評,能夠將學生的發音和韻律通過與標準音比對,來幫助其提升發音準確度。
在泛娛樂行業中,比如在直播中,主播說一些特定關鍵詞命令,通過語音識別就可以在平臺上自動產生一些交互效果,從而增強娛樂性和用戶黏性。這也通常和機器視覺技術一起使用,識別主播的特定動作和手勢,產生動畫特效。這套解決方案,直播平臺、經紀公司和網紅主播都可以使用。
但是,AI語音也面臨一些挑戰。以當下正在風口的智能音箱為例,互聯網專家、DCCI互聯網研討院院長劉興亮分析,國內的智能家電還沒有那么普及,消費者也還沒有將一般家電更換為智能家電的剛需,大多數我國家庭對音箱的音質好壞、是否聯網并沒有強烈的要求。這或許將讓智能音箱在我國成為一個“偽痛點”“偽需求”。
分析人士也指出,在國外風生水起的智能音箱,在國內市場面臨本土化的問題。首先,漢語因為方言差異等因素,語音識別和語義交互以及對話式交互技術比英語要復雜得多,遠未成熟,設備提供的交互體驗距離真正無障礙的人際交互還有距離,這將影響用戶體驗。
其次,智能音箱的“核心價值”沒有標準化,用戶不知道究竟該為好的音質買單還是為智能買單;再者,國內企業缺乏像亞馬遜、谷歌那樣跨越多個垂直領域進行資源整合的能力;此外,類似亞馬遜對Echo的補貼經營策略,對于要求利潤的制造商來說很難實現。
許多較為成功的國內AI企業負責人都認同的是,AI是一種非常基礎的資源,對各個行業來說都是賦能的,企業把相對成熟的技術去引入相對成熟的領域,順勢而為,才能成功。AI作為底層技術,必須搭載服務和應用,考驗的是資源整合能力。因此,只做音箱硬件,顯然無法真正推廣AI語音;但要做到亞馬遜Alexa這樣的整合程度,讓大量的AI語音設備都愿意接入統一的平臺,國內的BAT,乃至京東、喜馬拉雅雖然都在嘗試,但它們之間真的能互相打通,成為健康的生態平臺嗎?想一想這些巨頭之間互掐的歷史,就知道這有多么不容易。阻礙AI發展的,往往并不是技術本身。
聯系手機:13304082001 公司熱線: 0411-87329315 網站備案/許可證號遼ICP備13006033號-2
聯系人: 王森觀 總經理助理 Email:Loong_group@yeah.net 聯系地址:大連市經濟技術開發區淮河中路1173號