音频筑基:基音、基频和共振峰

发布时间:2023年12月21日

音频筑基:基音、基频和共振峰

音频信号分析中,经常遇到基音、周期、共振峰的概念,这里总结下自己的粗浅理解,不当之处,还望各位大佬提出指正。

是什么


基音,是复音中强度最大、频率最低的音。表征着声音的音高,即人们所感知到的音调高低。通常是以频率维度衡量,所以也叫基音频率,简称基频F0。有时粗略讲,又叫音高,英文名Pitch。

  • 基音周期Period:气流经声门的周期间隔,体现声源激励信息,设时间为T(s),物理含义为是时域波形最小重复的时间。
    • 周期Period是指声音波形中一个完整的周期所需要的时间。
    • 周期Period一般可以通过分析波形的重复模式来确定,比如:计算波形中相邻两个峰值(或谷值)之间的时间间隔来获得。
  • 基音频率Fundamental Frequency,是基音周期的倒数F0=1/T

共振峰,英文名Formant,表现为频谱上由基频衍生的次谐波(能量最强的一根根横线)。

  • 共振峰产生原理:F1、F2,经声门后来到声道处与发声环境产生共振的频率,体现声道环境信息。

深入理解


周期Period和基音Pitch如何转换?

Pitch指的是音频信号的基波周期,用周期或者频率来表示,如周期为4.3ms,对应频率就是230Hz,跟频谱图的频率概念是有别的。语音信号场景,基音指标十分重要。

转换公式为:Pitch = 1 / Period。换句话说,基音Pitch的值是周期Period的倒数。这意味着,周期越短,基音Pitch就越高;周期越长,基音Pitch就越低。

严格意义上讲,音高Pitch和基频F0有何区别?

严格说,音高的概念更广,音高主要由基频决定。通常认为,音高增高八度音程相当于基频翻倍。

  • 基频F0是指声音波形中最低频率的周期性振动频率,也就是声音的基频。在语音信号中,基频F0通常对应于说话人的声调(tone),也就是说话人说话时的基本音高。基频F0的单位是赫兹(Hz)。
  • 基音Pitch是指声音的音高,通常用赫兹(Hz)或半音(semitone)来表示。在音乐领域中,Pitch通常指的是乐器演奏的音高,而在语音领域中,Pitch通常指的是说话人的音高。

相关参考


  1. 声音基频f0_音高和基频(Pitch and F0),link
  2. 音频(二) 基音周期与共振峰, link
  3. 基音周期和共振峰,link
  4. Wikipedia:共振峰,link
  5. 口语元音中的共振峰和谐波,link
文章来源:https://blog.csdn.net/qq_17256689/article/details/135138999
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。