技術(shù)類(lèi)型: 發(fā)明專(zhuān)利
交易方式: 完全轉讓
專(zhuān)利號:CN201910888992.9
本發(fā)明公開(kāi)了一種結合DenseNet和resBi?LSTM的中文句子級唇語(yǔ)識別方法,本發(fā)明將唇語(yǔ)識別拆分為拼音預測與語(yǔ)言翻譯兩個(gè)部分,降低了唇語(yǔ)識別的難度。
使用DenseNet提取視覺(jué)特征,充分利用淺層特征,有效緩解了梯度消失的問(wèn)題,并且減少了網(wǎng)絡(luò )的參數。使用1×1卷積代替全連接實(shí)現特征降維的功能,保留了特征中的空間信息,在唇語(yǔ)識別技術(shù)研究中,空間信息起著(zhù)重要作用。
使用resBi?LSTM進(jìn)行視覺(jué)特征的處理,最后得到結合了視覺(jué)特征和語(yǔ)義特征的復雜特征,減少了有效信息的損失,提高了唇語(yǔ)識別的準確率。
主辦單位:營(yíng)口市科學(xué)技術(shù)局 服務(wù)咨詢(xún):0417-2833747
地址:遼寧省營(yíng)口市站前區少年宮里學(xué)府園A4
技術(shù)支持:科易網(wǎng)