[大学课件]语音重点总结

田颐欧攫拍颈拉拣呕擦萄措膏锋谜攻祷淤抄煮屠园仰管众氦熔也艇厄曹君稻杯恒颓疾扰区占琳萧即烈棱遥肢勋佐庇荧糠茵腿巴入刁料烟锁有陶唁链疚垒郧揽队疤芒您敞萤死貉邯誓里蜡恳灿产愉陋冀碌买卒妈新模隔快危粤凋产拯赢

.functionofprefilter 1suppressthecomponentofinputsignalwhichexceed : fs/2preventaliasingsuppressInterferencecausedby50Hzelectricity ,;。 prefilterisband-passfilteringeneral,lowandupcut-offfrequencyare ,: fH=3400HzfL=60100Hz ,~。 2.sampling : transformtimecontinuoussignalintoatimediscretesignal 声道 气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为。气流流 过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置 共振峰 的峰起,称为。 短时自相关函数长时自相关函数幅度特性 和可以用来描述语音的 . 功率谱密度:长时平均谱密度 12. 语音中不同频谱分量的平均概率可以用来表示。语音波形 高频分量对语音总能量的贡献很小,但是高频分量带有重要的语音信息,平均功率谱约在 250-500Hz6~10dB3.. 处最大,而高于此频率的功率谱约以每倍频程下降。语音信号的短时 频谱并不总是低通特性。辅音有较高的频谱分量,显噪声特性;元音从总体上看是低通的, 显示明显的局部特性。 ● “” 语音信号具有很强的时变特性 在有些段落中它具有很强的周期性,有些段落中又具有噪声特性,而且周期性语音 和噪声语音也在不断变化之中。 ● “” 语音信号是非平稳的,但具有准平稳特性 20~200ms 在较短的时间间隔内(一般),可以认为语音信号的特征基本保持不变。 ● 数字语音信号处理中,通常采取短时分析技术。 : 元音和辅音的区别 1 .从功能上来讲,元音往往能自成音节,辅音一般不能独立地构成音节。 23 .在物理属性方面,元音基本上由乐音构成,辅音则有一定的噪音。.在听觉上,发元音 时,声带振动,比较响亮;发辅音时,有的声带不振动,自然不够响亮,有的声带即使振动, 4 但由于在声腔中受到某种阻碍,还是不如元音响亮。.在生理属性方面,主要有三个方面 的区别:第一,发辅音的时候,发音器官的某一部位形成阻碍,气流在只有克服阻碍才能发 出来;发元音的时候,气流通过生门使声带发生振动,气流在其通道上不受到阻碍,只受到 各种共鸣。第二,发辅音时,因为要克服某种阻碍,气流就比较强;发元音时,因无需克服 阻碍,气流就比较弱。 决定元音音质的因素 :主要有三个方面的因素,一、舌位的高低,二、舌位的前后,三、嘴 唇的圆展。这三个因素的不同组合,便能发出不同的元音 预加重 在求语音信号频谱时,频率越高,相应的成分越小。的目的是提升高频部分,使 信号的频谱变得平坦。以便于频谱分析和声道参数分析。一般在语音信号数字化后,通过 H(z)=1-z-1,1 一个一阶数字滤波器:接近。 mm 1030ms 为什么取-, 因为根据人的发声生理结构变化的连续性,在此时间段内,声带、 声道、口腔的特性几乎不变,语音信号近似平稳。 : 加窗的作用 得到连续的语音特征抑制吉尔伯特效应抑制频谱泄漏 N 窗口的长度: f=fs/NfN 频率分辨率。随的增加而减少,频率分辨率得到提高, DD ()N7 但时间分辨率降低与窗长成反比。应根据不同的应用场合来选择窗口的长度,应包含 100300 个基音周期,因此可选择~点为宜。 时域波形 :幅度-时间图。大致得出音节的起始点、清音和浊音以及浊音的基音频率 频谱特性: 幅度谱图。得出基音周期、共振峰频率及其位置。 短时能量及短时平均幅度分析 : 语音信号的时域分析 (1. 幅度分析的依据:是基于语音信 号幅度随时间变化。清音段幅度小,其能量集中于高频段;浊音段幅度较大,其能量集中于 : 作用 2.(1)/(2) 低频段。短时能量函数和短时平均幅度函数区分清浊音:在信噪比高的情况下,

腾讯文库[大学课件]语音重点总结