發布日期:2022-04-17 點擊率:39
在智能家居給人們帶來便捷生活的同時,人們的控制習慣逐漸發生改變。語音技術的發展也為控制入口做了一個補充,在拋去了傳統遙控器和手機APP之后,通過口令發送讓家居環境達到舒適狀態,讓生活更便捷智能,這是否會成為智能家居行業下一個階段的普遍應用?
遠場語音識別、云端語義辨識、人工智能應用等等一個個技術節點得到新的突破,為智能家居提供了新的控制入口選擇。本文將從技術趨勢、解決方案、產品應用、項目實施等多角度為您呈現語音控制技術在智能家居產品和集成項目中的應用前景。
所謂智能語音產業,主要指通過語音合成技術和語音識別技術,為用戶提供各種服務的產業。一般來說,用戶只需要用說話的方式給服務終端發布命令,就能得到相應的服務。這一產業從上世紀六十年代就已出現,但并不為普通消費者所熟知,消費者對其認知度也比較低。近年來,隨著蘋果、谷歌、微軟等公司先后推出Siri等智能語音服務,這一服務以及相關產業也開始被普通消費者和投資界所關注。
語音控制技術
與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的技術。
語音識別是一門交叉學科,語音識別技術與語音合成技術結合使人們能夠甩掉鍵盤,通過語音命令進行操作,語音技術的應用已經成為一個具有競爭性的新興高技術產業。
目前語音控制技術存在的問題
目前,對于語音控制類的智能硬件產品在很多場景下因語音交互體驗不如人意而深受詬病,究其原因主要是受限于空間距離、背景噪音、其他人聲干擾、回聲、混響等多重復雜因素,進而導致的識別距離近、識別率低等明顯痛點。
除此之外,單是中國語系、方言和口音就相當多,加上中文的多語義性,所以不同地區的人使用語音控制識別率差異較大。同時,在語義識別上,也存在上下文的關聯帶來識別的學習難、定位難和建立模型難等問題。
語音識別的幾種控制技術
“語音識別”技術相當于給計算機系統安裝上“耳朵”,使其具備“能聽”的功能。該技術經過語音信號處理、語音特征處理、模型訓練及解碼引擎等復雜步驟,使機器最終能夠將語音中的內容、說話人、語種等信息識別出來。語音控制功能的實現,與用戶的使用習慣高度關聯。目前的語音控制功能實現方式可分為近場語音識別和遠場語音識別二個大類。
近場/遠場語音識別技術
近場語音識別,需要用戶點擊啟動,并且用戶與終端設備的距離比較近,如手機或其他終端設備,可直接借助這些終端設備的實現控制功能。
遠場語音識別,以麥克風陣列遠距離拾取的語音數據作為輸入數據,通過語音識別的算法將語音信號轉寫成文字的技術。雖然和近場語音識別技術在原理上是相同的,但是由于音源和麥克風之間的空間距離增大,在聲波傳播過程中會出現信號強度的衰減和各種噪音干擾,因此需要特殊的語音數據拾取和預處理技術。不同的拾取設備和預處理技術常常會使用于語音識別的聲波信號特征發生改變,因此針對不同的遠場語音拾取技術,需要對語音識別引擎進行定制化適配和優化。
下一篇: PLC、DCS、FCS三大控
上一篇: 索爾維全系列Solef?PV