噪声数据库

发布时间:2024年01月11日
  1. 语音降噪用到的 场景噪声:Audio research group - Tampere University - TUT Acoustic scenes 2017 released
  2. https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT

TUT 原声场景 2017 发布

?发布日期:2017 年 11 月 13 日

我们的研究小组发布了用于声学场景分类研究的开放数据集,TUT Acoustic Sc??enes 2017。该数据集由来自各种声学场景的录音组成,所有这些场景都有不同的录音位置。对于每个录音位置,都会捕获 3-5 分钟长的录音。然后将原始录音分成长度为 10 秒的片段。数据集分为开发数据集评估数据集两部分发布,可以从Zenodo下载。

该数据集于 06/2015 至 01/2017 期间在芬兰收集,该集合已获得欧洲研究理事会的资助。

?

数据集中的声学场景 (15):

  • 巴士 - 在城市内乘坐巴士(车辆)
  • 咖啡厅/餐厅 - 小咖啡厅/餐厅(室内)
  • 汽车 - 在城市中作为乘客驾驶或旅行(车辆)
  • 市中心(室外)
  • 林间小路(室外)
  • 杂货店 - 中型杂货店(室内)
  • 家庭(室内)
  • 湖滨沙滩(室外)
  • 图书馆(室内)
  • 地铁站(室内)
  • 办公室 - 多人,典型工作日(室内)
  • 住宅区(室外)
  • 火车(旅行、车辆)
  • 有轨电车(旅行、车辆)
  • 城市公园(室外)

记录和注释程序

对于所有声学场景,录音都是在不同的地点捕获的:不同的街道、不同的公园、不同的家庭。使用?Soundman OKM II Klassik/studio A3、驻极体双耳麦克风和?Roland Edirol R-09?录音机进行录音,采用 44.1 kHz 采样率和 24 位分辨率。麦克风经过专门设计,看起来像耳机,戴在耳朵上。因此,录制的音频与到达佩戴设备的人的人类听觉系统的声音非常相似。

记录数据的后处理涉及与记录个人隐私相关的方面。对于在私人场所录制的音频材料,必须获得所有相关人员的书面同意。在公共场所录制的材料不需要此类同意,但会进行内容筛选,并删除侵犯隐私的片段。

TAU Urban Acoustic Scenes 2020 Mobile, Development dataset

  1. ——————————————————————————————————————————
  1. https://dataverse.harvard.edu/dataset.xhtml?persistentId=doi:10.7910/DVN/YDEPUT?Harvard 大学 采集的纯净语音和 混合之后的语音
  2. ?原文不能收藏,转发,就写这里了:语音行业有什么好用的开源噪声库吗???????

  3. Audio research group - Tampere University - Datasets?这里面很多,下载比较麻烦点,需要找需要的
  4. ?http://www.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification
  5. .?语音和噪声相关数据集(持续更新) - 凌逆战 - 博客园?:

????????????????目录

语音数据集
TIMIT
VCTK
AISHELL-ASR0009-OS1 开源中文语音数据库
Mozilla Common Voice
Tatoeba
日语数据集
气导骨导数据集
噪声数据集
noise-92
NOIZEUS数据集
DEMAND
PNL 100 Nonspeech Sounds
rnnoise_ontributions
COUGHVID 众包数据集
ESC-50:环境声音分类数据集
ESC环境噪音分类数据集
DESED dataset
DISCO
婴儿啼哭数据集
风噪数据集
YouTube--ASMR noise
FSD50K
MS-SNSD
QUT-NOISE
freesound-datasets
STARSS22:Sony-TAu Realistic Spatial Soundscapes 2022
VOICe Dataset
In-Vehicle Noise Dataset
Vehicle Interior Sound Dataset
MAVD交通数据集
Dataset-AOB:城市声音事件分类
CHiME-Home
UrbanSound
UrbanSound8K
SONYC Urban Sound Tagging
Isolated urban sound database
Acoustic Event Dataset
BBC音效
NAR 数据集
asr-noises
音乐数据集
DCASE
综合数据集
MUSAN
FSDnoisy18k
DS_10283_2791
CSTR NAM TIMIT Plus
参考

6.?希尔贝壳-专注于人工智能大数据和技术的创新

语音行业有什么好用的开源噪声库吗?

像是asr asv等等领域,我们经常要用噪声来做数据增强提升模型鲁棒性,那么有什么好用的开源噪声库吗?

我最喜欢用的就是openslr里面录制的混响和加性噪声~
混响的:http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated,用的比较多是simulated中的小房间中房间,对应房间大小分别是1~10m和10~30m
加性的:http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble,音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~
另外就是用sox改改音速和音量,这些dither也可以纳入考虑
发布于 2019-03-25 12:29
?赞同 37??15 条评论?分享
?收藏?喜欢?

传统的开源噪声库有:
NOISEX-92
DEMAND
CHIME CHELLENGE里的噪声源
以上都是专门针对噪声鲁棒性训练和评价设计的噪声库。缺点是都比较小。

还有其他两个option:
~ 可以试试训练声音事件分类器用的数据集,比如AudioSet,数据很大。
~ 或者花钱买电影音效库,比如bbc什么的。数据很多,质量高。就是不便宜。
————————————————————

我用的不算专用的噪音库,是一个声学场景分类的噪音,场景比较多,但是不是非常符合噪音这个范畴,可以用来做aec。
TUT dataset:
Acoustic scenes for the task (15):

  • Bus - traveling by bus in the city (vehicle)
  • Cafe / Restaurant - small cafe/restaurant (indoor)
  • Car - driving or traveling as a passenger, in the city (vehicle)
  • City center (outdoor)
  • Forest path (outdoor)
  • Grocery store - medium size grocery store (indoor)
  • Home (indoor)
  • Lakeside beach (outdoor)
  • Library (indoor)
  • Metro station (indoor)
  • Office - multiple persons, typical work day (indoor)
  • Residential area (outdoor)
  • Train (traveling, vehicle)
  • Tram (traveling, vehicle)
  • Urban park (outdoor)

Acoustic scene classification?www.cs.tut.fi/sgn/arg/dcase2017/challenge/task-acoustic-scene-classification?编辑



有个可推荐的,不仅仅是噪声。
sox。SOund eXchange lib。
是个音频特效库。包括回声,变调,变速,带通等等。
但噪声方面比较弱,只自带了各种波形的发生器,自然环境噪声需要自己搜集一些音频文件。
最大的缺点是只能用文件到文件的模式处理音频,使用tmpfs可以有效缓解这个问题。

文章来源:https://blog.csdn.net/qq_35243382/article/details/135506124
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。