音频筑基:瞬态、基音、偏噪信号类型分析
发布时间:2023年12月18日
在分析音频信号中,不同信号类型如瞬态、基音、偏噪信号是我们经常遇到的概念,这里谈谈自己的理解。
是什么
- Transient Signal:瞬态信号
- 时域表现:时域中信号反复突变,周期不明显,如在动态范围内突变不连续
- 频域表现:频率成分分布广,在有限码率下,以编码频点的方式无法完全刻画
- 信号实例:现实世界里的物品敲击音、乒乓球落地的声音
- Pitched Signal:基音信号
- 时域表现:时域内周期明显,相同包络信号反复拼接
- 频域表现:频域内表现为一根根谐波,层次分明
- 信号实例:人声清唱、钢琴音、琴弦扫弦音
- Noise Signal:偏噪信号
- 时域表现:时域内呈现随机性,变化剧烈
- 频域表现:频谱铺的很满,在基波和次谐波上叠加了许多早是你提供
- 信号实例:乐器嘈杂的流行乐,背景嘈杂的摇滚乐
基音的概念:
基音是指声音中最低的频率成分,也就是声音的基础频率,它是声音音调的主要决定因素之一。
简单说,分析声音信号的频谱,找出其中最强的频率成分,这个频率就是声音的基频或基音。
深入理解
从编码角度看,基音信号编码通常会有啥问题?
- 基音信号一般周期会大于帧长,导致无法准确获取谐波。常见的解决方式是加入长短窗切换。
在频域感知编码过程中,瞬态信号会有啥问题?如何解决?
- 时域编码对瞬态信号表现好,瞬态为突变信号,频域特征不明显,不利于编码表达。
- 瞬态信号通常会在频域编码中产生预回声问题。
常见解决方法:
- 长短窗切换,遇到瞬态信号用短窗变换。自适应窗切换技术是感知音频编码技术领域的一项重要技术,其主要作用是抑制暂态信号引起的预回声问题。
- TNS,在编码段,TNS技术对检测到的暂态信号的频谱系数进行线性预测分析,在解码端,对暂态信号进行频谱预测合成,可以调节误差的形状以适应输入音频信号的时域形状,从而将编码噪声置于解码信号之下,大幅降低量化噪声对解码后音频主观听觉的影响。
瞬态信号场景下,5/10ms帧长编码有啥区别?是否短帧长更有优势?
- 客观上,同码率下,短帧长总体残差是要大于长帧长。
- 主观上,短帧长预回声现象减少,突变更清脆,有瞬态感,主观听感短帧长控制的更好。
文章来源:https://blog.csdn.net/qq_17256689/article/details/135070414
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!