聽覺信息處理技術(shù)的創(chuàng)新能夠推動實現(xiàn)高度智能化機器感知系統(tǒng)的發(fā)展,本分冊主要介紹了國內(nèi)外聽覺信息處理方面的研究現(xiàn)狀和階段性成果,通過對人類言語產(chǎn)生與聽覺機理,聽覺機理的計算理論與方法,語音信號處理,語音識別聲學(xué)建模,特殊場景語音識別,聲紋與語種識別,韻律、情緒及音樂分析,統(tǒng)計語音合成,口語對話系統(tǒng)等技術(shù)研究成果的闡述與分
《語音信號識別技術(shù)與實踐》內(nèi)容分為8章。第1章為語音識別技術(shù)概述,介紹了語音識別技術(shù)的原理和發(fā)展與應(yīng)用。第2章為語音信號處理基本技術(shù),包括數(shù)字化預(yù)處理、短時時域處理和頻域處理的內(nèi)容。第3章是語音信號的端點檢測和分割,介紹了端點檢測的原理和常規(guī)檢測方法,提出了基于復(fù)雜背景條件下的端點檢測算法,包括算法流程和實驗方法。第4
語音情感識別(SpeechEmotionRecognition,SER)是情感計算、模式識別、信號處理和人機交互領(lǐng)域的熱門研究話題,SER的研究涉及特征提取、特征優(yōu)選、分類器改進(jìn)、特征融合等多種技術(shù)。語音情感識別是在同一數(shù)據(jù)庫中進(jìn)行的識別研究,主要應(yīng)用于自然的人機交互領(lǐng)域,目前大部分的人機交互方式都依賴于觸覺,如觸屏、
本書是面向從事音頻領(lǐng)域研究的專業(yè)書籍。通過此書,讀者能夠掌握空間線索在音頻中應(yīng)用的基礎(chǔ)知識,并能了解空間音頻技術(shù)在3D音頻研究的一些前沿內(nèi)容和實驗手段。本書概念講解清楚、系統(tǒng)性強,是作者多年來從事數(shù)字音頻編碼工作并指導(dǎo)研究生開展研究的經(jīng)驗總結(jié),具有較強的實用性,可供高等院校相關(guān)專業(yè)的高年級本科生、研究生和工程技術(shù)人員
本書是音響技術(shù)與音樂欣賞相關(guān)知識的百科,內(nèi)容深入淺出、側(cè)重實用而新穎全面。全書分4部分:(1)電聲基礎(chǔ),包括聲學(xué)和音響的基礎(chǔ)知識;(2)音響釋疑420例,對420個有關(guān)音響技術(shù)的實際問題進(jìn)行解釋;(3)音樂與欣賞,提供欣賞音樂和選購軟件的相關(guān)知識;(4)電子音響史料,介紹電子音響技術(shù)的發(fā)展沿革。 音響實際涉及的知識門類
本書系統(tǒng)地介紹語音信號處理的基礎(chǔ)、概念、原理、方法與應(yīng)用。全書共分9章。第1章介紹語音信號處理及其發(fā)展過程;第2章介紹語音信號的產(chǎn)生與人類聽覺的機理,傳統(tǒng)的線性語音產(chǎn)生模型,以及非線性語音產(chǎn)生模型;第3章從語音信號的時域特征入手,引入時頻分析的思想,并進(jìn)一步闡述時頻分析中短時傅里葉變換和小波變換在語音信號特征分析中的應(yīng)
在本書中,業(yè)界專家湯姆林森?霍爾曼(TomlinsonHolman)和亞瑟?鮑姆(ArthurBaum)提供了大量的工具和專業(yè)知識,展現(xiàn)了音頻捕捉、視頻錄制、剪輯流程和混錄的最新發(fā)展,可以幫助你的電影或視頻制作達(dá)到驚人的效果。這本最新版(第2版)包含聲音制作從前期到后期在技術(shù)、技巧和工藝流程上的秘密,并收入以下最新內(nèi)容
數(shù)字技術(shù)的快速發(fā)展和網(wǎng)絡(luò)應(yīng)用的普及,帶動現(xiàn)場擴聲設(shè)備從模擬時代向數(shù)字化時代轉(zhuǎn)變,涌現(xiàn)出各種品牌的數(shù)字調(diào)音臺、數(shù)字信號處理器、數(shù)字功率放大器等數(shù)字化音頻設(shè)備,可以利用計算機軟件配合完成擴聲工程設(shè)計、聲場覆蓋模擬、電聲調(diào)試等工作,利用網(wǎng)絡(luò)實現(xiàn)遠(yuǎn)距離傳輸,解決長距離音頻信號衰減的難題。本書以現(xiàn)場演出的數(shù)字?jǐn)U音設(shè)備為實例,介紹
本書從人類聽覺、視覺的處理機制出發(fā),系統(tǒng)地介紹了聽覺和視覺感知模型、數(shù)字音頻技術(shù)、音視頻(圖像)壓縮編碼技術(shù)、音視頻(圖像)處理技術(shù)和基于內(nèi)容的音視頻(圖像)檢索技術(shù)等內(nèi)容。在介紹各部分內(nèi)容的同時,給出了相關(guān)知識的應(yīng)用實例,具有較高的參考學(xué)習(xí)和實用價值。本書覆蓋的學(xué)科領(lǐng)域十分廣泛,包括人工智能、信號處理、圖像處理、語音
本書內(nèi)容的編排和組織是以通信行業(yè)的發(fā)展、通信企業(yè)的需求、學(xué)生的認(rèn)知規(guī)律、多年的教學(xué)經(jīng)驗積累為依據(jù)確定的。以崗位工作流程為導(dǎo)向,在經(jīng)過充分市場調(diào)研的基礎(chǔ)上,立足于NGN網(wǎng)絡(luò)基礎(chǔ)原理、軟交換技術(shù)、VoIP基本原理的職業(yè)能力培養(yǎng)。經(jīng)過行業(yè)專家深入、細(xì)致、系統(tǒng)的分析,通過調(diào)研報告分析,本教程*終確定了以下8個學(xué)習(xí)情境:首先認(rèn)識