- 时域: 短时能量、短时过零率、短时相关性特征被广泛应用
- 频域: 谱熵、方差、倒谱距离、小波变换等特征也被认为是端点检测的有效参数
- 实际生活中出现的大多都是非平稳噪声
如典型的瞬态干扰:键盘敲击、敲门声等- 具有 时间短、频域广 等特点,会对语音造成极大的干扰
1、表示被测信号
y
(
n
)
y(n)
y(n)
y
(
n
)
=
x
(
n
)
+
d
(
n
)
+
t
(
n
)
y(n)=x(n)+d(n)+t(n)
y(n)=x(n)+d(n)+t(n)
【
x
(
n
)
x(n)
x(n)为语音信号、
d
(
n
)
d(n)
d(n) 为加性平稳噪声、
t
(
n
)
t(n)
t(n)?为瞬态噪声】
(感觉和eemd处理很相似:eemd加了一段白噪声)
2、 y ( n ) y(n) y(n) 信号经过加窗、快速傅里叶变换FFT 后可实现 短时傅里叶变换SFFT
3、对 最小控制递归平均MCRA 的 平滑参数 进行调整再加入反因果窗区分瞬态
可为修正的 OM-LSA 算法提供准确的噪声 PSD估计(这一步感觉这种新处理方法的关键)
虚线框图为调整部分
注:IFFT为 逆傅里叶变换
- FFT:快速傅里叶变换
信号从 时域转换到频域 ,FFT变换的结果是复数(即得到的频域是复数)- IFFT:逆快速傅里叶变换
信号从 频域转换到时域 ,将频域数据(复数)进行虚部取反得到共轭复数然后在进行FFT变换得到时域数据
%% 使用 快速傅里叶变换算法 计算 Y的逆离散傅里叶变换(X 与 Y 的大小相同)
X = ifft(Y)
% 如果 Y 是向量,则 ifft(Y) 返回该向量的逆变换。
% 如果 Y 是矩阵,则 ifft(Y) 返回该矩阵每一列的逆变换。
% 如果 Y 是多维数组,则 ifft(Y) 将大小不等于 1 的第一个维度上的值视为向量,并返回每个向量的逆变换。
即 X = = i f f t ( f f t ( X ) ) X==ifft(fft(X)) X==ifft(fft(X)) 等式是成立的
参考文献:一种低信噪比环境下的语音端点检测算法-卜玉婷,曾庆宁,郑展恒.pdf