低SNR下汉语单音节清晰度测量与可懂度估计
1970/01/01 19:10 点击:835 / 回复:0
刘 辉, 章斯宇, 孟子厚
(中国传媒大学传播声学研究所, 北京100024)
[商 要]在实验室条件下测量了不同频带范围、不同信噪比条件时的语言清晰度和STI-PA,分析了清晰度,STI- PA与信噪比的关系,并根据单音节清晰度与语言可懂度的关系,估计了在满足一定可懂度条件下的最低信噪比及 相应的STI-PA。
[关键词]语言清晰度;语言传输指数;信噪比;汉语普通话
[中图分类号]TB54 [文献标识码]A
Test On Mandarin Monosyllable Clarity and Speech Intelligibility Estimation With Low SNR
LIU Hui, ZHANG Si-yu, MENG Zi-hou
(Communleatlon Acoustics Laboratory,Communication University of China,Beijing 100024,China)
[Abstract]A laboratory test is carried out tO test the Mandarin monosyllable clarity and STI-PA with several noises including different bandwidth Or different SNR.The relationship between clarity and SNR and between STI-PA and SNR are derived from the test result.The SNR threshold and STI-PA threshold are also estimated based On the relationship between speech clarity and speech intelligibility.
[Key words]speech clarity;speech transmission index;signal-to-noise ratm(SNR);Mandarin
1 引言
语言清晰度主要受环境噪声、环境混响、系统失真三方面的影响[1]。对于户外远距离声音广播,声音在远距离传输过程中经过衰减,到达听音人所在处时,由于环境噪声的影响,信噪比往往已经很低了,甚至低于0dB,在如此低的信噪比条件下,语言清晰度究竟受到多大影响,是设计户外远距离声音广播系统时所关心的问题。而对于环境混响来说,由于户外不存在过多反射界面,且自然环境中存在的吸声体较多,如树木,草地,人等,所以在户外远距离广播条件下,环境混响对语言清晰度的影响不是最主要的。系统无明显的失真是对扩声系统的基本要求,达不到这个要求不能看作是1个合格的扩声系统。因此,笔者主要考察的是在低信噪比条件下,噪声掩蔽对语言清晰度的影响。
研究噪声掩蔽对语言清晰度和语言传输指数的影响,应该是在大量不同的噪声环境现场实地测量,但是由于客观条件的制约,理想的测量条件几乎是不可能实现的。笔者在实验室可控条件下,依据相关的语言清晰度测试标准[2]测量了不同频带、不同信噪比噪声条件下的汉语普通话单音节清晰度和语言传输指数STI-PA,以期对研究噪声掩蔽下普通话单音节清晰度与信噪比的关系有所帮助。
2 汉语单音节清晰度测量方法
测量参照相关标准[2]进行。采用在实验室录音、模拟测试的方法。将录制的语音干信号与不同频带的噪声叠加以模拟受噪声掩蔽后的语音信号,然后在测听室内将此信号回放给听音人来评测语音的清晰度,同时测量在相应噪声干扰下的STI-PA,并进一步分析清晰度、STI-PA与信噪比的关系。
语音信号是由男、女2名专业播音员按照标准普通话,以自然平稳、正常语速(4个单音节/s。)在混响时间小于0.1s,背景噪声低于20dB(A)的录音室内朗读的标准单音节字表。为了避免记忆对实验结果的影响,不同的噪声条件对应的实验信号均采用不同的字表。考虑到不同环境的噪声特性不同以及语音的频谱特性,采用了全频带白噪声和中心频率为250Hz,500Hz,1kHz,2kHz,4kHz,8kHz的倍频带噪声作为干扰噪声, 各频带噪声分别设置4~5种信噪比。语音信号与各噪声信号按照预先设计好的信噪比进行混叠后用于被试测听。
听音在面积为约70m2,混响时间低于0.3s,频响基本平直的测听室内进行,实验信号通过GENELEC监听音箱重放。听音人耳朵处的声压级控制在65dB(A)左右。经过信度检验的有效听音人由12位在校研究生组成,年龄21~25岁,男女比例基本平衡,听力正常,且有多次测听实验的经历,实验前也经过必要的训练。听音人以组为单位进行测听,听完1组音后,记录下自认为听到的单音节字汉语拼音。
3 实验结果与分析
分别统计测量各噪声条件下的单音节清晰度及STI-PA。以全频带白噪声和中心频率在2kHz的倍频带噪声的结果为例,单音节清晰度和STI-PA以及与信噪比的关系如图1和图2所示,其中横轴对应信噪比,纵轴对应清晰度或STI-PA。
图1 全频带白噪声掩蔽条件下单音节清晰度和STI-PA与信噪比的关系
图2 中心频率2kHz的倍频带噪声掩蔽条件下单音节清晰度和STI-PA与信噪比的关系
由于条件所限,实际测听时,信噪比很低和很高情况下的实验未完全进行,这2种极端条件下的实验数据缺失。但在理论上可认为当信噪比很低时,STI-PA趋于0,单音节清晰度也趋于0;当信噪比很高时,STI-PA趋于1,单音节清晰度也趋于1。将极端限定条件与实验结果综合,对数据进行拟合得到图1~2中的曲线。
如图1中所示的白噪声掩蔽下男声的单音节清晰度,STI-PA与信噪比的关系为
C=-0.0005R2+0.033 5R+0.5603 (1)
S=-0.0004R2+0.0230R+0.3949 (2)
女声的清晰度、STI-PA与信噪比关系为
C:0.000 3R2+0.024 8R+0.595 9 (3)
S:0.0005R2+0.021 1R+0.336 3 (4)
式中,C为语言清晰度;S为STI-PA;R为信噪比(单位:dB)。
对其余频带噪声下的结果也进行了类似的分析。结果表明,语言清晰度与噪声的信噪比和频带范围有着密切关系。语言清晰度、STI-PA与信噪比有着一致单调的关系,随着信噪比的降低或增加,清晰度和STI-PA也会相应降低或增加。其中,全频带白噪声对语言清晰度影响最大,与其余噪声条件相比,同等信噪比条件下清晰度是最低的。中心频率为8 kHz的倍频带噪声对清晰度的影响最小。这与掩蔽噪声频率范围与语音频率范围相差越大,掩蔽效果越小是相一致的。另外发现同等噪声条件下女声的清晰度较高于男声,抗干扰能力较强。
4 基于测量结果的语言可懂度估计
根据上述清晰度与信噪比的拟合结果,能够预测不同信噪比时所对应的清晰度,由于单音节清晰度与语言可懂度存在着一定的关系[3-5],相反可估计达到一定可懂度要求时所需的最低信噪比及对应的STI-PA。统计所有有效受试人对男、女声2组词表最低信噪比和STI-PA预测结果的平均如表1所示。
表1 不同噪声条件下达到不同清晰度/可懂度对应的最低信噪比SNR(dB)和STI-PA
由表1可知,在白噪声条件下,清晰度要达到0.6,相应可懂度达到95%,信噪比应不低于0.7dB,此时对应的STI-PA值为0.38。
当语言清晰度或可懂度指标保持稳定时,噪声中心频率与信噪比及STI-PA的关系如图3所示,其中,横轴采用的是对数频率尺度。从图3可以看出,不同的噪声条件可能会导致相同的语言可懂度,当清晰度或者可懂度一定时,随着噪声中心频率的增加,为达到清晰度指标所需的最低信噪比逐渐增加,在2kHz左右处达到峰值,并随着中心频率的进一步增加最低信噪比又逐渐降低。这与语音的能量主要集中在1~3kHz频率范围是相关联的。而对于STI-PA来说,为了达到一定的语言可懂度要求,对特定的噪声条件应设置不同的STI-PA指标。
5 小结
在实验室条件下,对纯噪声掩蔽下,汉语单音节清晰度与SNR的关系以及STI-PA与信噪比的关系进行了测量分析。在实验结果的基础上,进一步根据“语言可懂度理论[3-5]分析了不同噪声条件下语言可懂度,STI-PA,信噪比之间关系。此关系对制定户外扩声系统的STI-PA指标具有实用意义。比如根据式(1)~(4),推算白噪声条件下,当信噪比分别为-5,0,5dB时的语言清晰度及可懂度,如表2所示。
由于测试工作是在实验室条件下进行的,考虑到
(b)噪声中心频率与STI-PA的关系
图3 全清晰度指标稳定时噪声中心频率与SNR和STI-PA关系
表2 白噪声条件下的语言评价指标
实际的应用情况,还有一些不完善的地方,比如实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试.每个频带噪声的信噪比取值区间可更加细致以获得更为全面的结果.另外,本次试验只是在65dB(A)(标准说话声压级)的噪声水平下进行的,其他噪声水平下的语言清晰度和STI-PA,信噪比的关系是否同本次试验结果一致还需要进一步的研究.
表2 白噪声条件下的语言评价指标
实际的应用情况,还有一些不完善的地方,比如实际环境中的噪声种类多样,频率范围丰富,由于条件限制无法一一进行测试.每个频带噪声的信噪比取值区间可更加细致以获得更为全面的结果.另外,本次试验只是在65dB(A)(标准说话声压级)的噪声水平下进行的,其他噪声水平下的语言清晰度和STI-PA,信噪比的关系是否同本次试验结果一致还需要进一步的研究.
参考文献
[1] 孟子厚,戴璐.混响作用下汉语单音节清晰度与STI-PA的关系[J].电声技术,2009,33(2):4-8.
[2] 国家技术监督局.GB/T 15508-1995 声学 语言清晰度测试方法[S].北京:中国标准出版社,1995.
[3] 中国建筑科学研究院建筑物理研究所.建筑声学设计手册[M].北京:中国建筑工业出版社,1987:521-523.
[4] 沈灏.扩声技术[M].北京:人民邮电出版社,1892:63.
[5] 马大猷,沈.声学手册[M].北京:科学出版社,2004:550-552.
文章:mobedu [1970/01/01 19:10]
评论
相关文章
- 遗传算法在带通式超重低音音箱设计中的应用
- 公共广播系统的应备声压级和音质评价
- 定压广播、调频广播、网络广播解析
- 景 区 无 线 应 急 广 播
- 实现作息信号、校园广播、音乐欣赏功能的三合一
- 快速、简易测量CobraNet信号的延时量
- 紧急广播在广播系统中应用的几点问题
- 低SNR下汉语单音节清晰度测量与可懂度估计
- 移相整流变压器三维漏磁场和短路阻抗的数值仿真研究
- 有关几项声学特性指标的测量结果及测量结果的比较
- 公共广播同专业音响的差别及其他
- 大学校园广播宣传特点浅探
- 可视城市街道公共广播系统
- 公共广播系统同专业音响系统的差别
- 移相整流变压器三维漏磁场和短路阻抗的数值仿真研究
- 3G可视远程会议系统
- 关于《背景音乐》
- 声频功率放大器的效率分析