音频筑基：瞬态、基音、偏噪信号类型分析

发布时间：2023年12月18日

音频筑基：瞬态、基音、偏噪信号类型分析

在分析音频信号中，不同信号类型如瞬态、基音、偏噪信号是我们经常遇到的概念，这里谈谈自己的理解。

是什么

Transient Signal：瞬态信号
- 时域表现：时域中信号反复突变，周期不明显，如在动态范围内突变不连续
- 频域表现：频率成分分布广，在有限码率下，以编码频点的方式无法完全刻画
- 信号实例：现实世界里的物品敲击音、乒乓球落地的声音
Pitched Signal：基音信号
- 时域表现：时域内周期明显，相同包络信号反复拼接
- 频域表现：频域内表现为一根根谐波，层次分明
- 信号实例：人声清唱、钢琴音、琴弦扫弦音
Noise Signal：偏噪信号
- 时域表现：时域内呈现随机性，变化剧烈
- 频域表现：频谱铺的很满，在基波和次谐波上叠加了许多早是你提供
- 信号实例：乐器嘈杂的流行乐，背景嘈杂的摇滚乐

基音的概念：

基音是指声音中最低的频率成分，也就是声音的基础频率，它是声音音调的主要决定因素之一。

简单说，分析声音信号的频谱，找出其中最强的频率成分，这个频率就是声音的基频或基音。

深入理解

从编码角度看，基音信号编码通常会有啥问题？

基音信号一般周期会大于帧长，导致无法准确获取谐波。常见的解决方式是加入长短窗切换。

在频域感知编码过程中，瞬态信号会有啥问题？如何解决？

时域编码对瞬态信号表现好，瞬态为突变信号，频域特征不明显，不利于编码表达。
瞬态信号通常会在频域编码中产生预回声问题。

常见解决方法：

长短窗切换，遇到瞬态信号用短窗变换。自适应窗切换技术是感知音频编码技术领域的一项重要技术，其主要作用是抑制暂态信号引起的预回声问题。
TNS，在编码段，TNS技术对检测到的暂态信号的频谱系数进行线性预测分析，在解码端，对暂态信号进行频谱预测合成，可以调节误差的形状以适应输入音频信号的时域形状，从而将编码噪声置于解码信号之下，大幅降低量化噪声对解码后音频主观听觉的影响。

瞬态信号场景下，5/10ms帧长编码有啥区别？是否短帧长更有优势？

客观上，同码率下，短帧长总体残差是要大于长帧长。
主观上，短帧长预回声现象减少，突变更清脆，有瞬态感，主观听感短帧长控制的更好。

文章来源:https://blog.csdn.net/qq_17256689/article/details/135070414
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！