?发布日期:2017 年 11 月 13 日
我们的研究小组发布了用于声学场景分类研究的开放数据集,TUT Acoustic Sc??enes 2017。该数据集由来自各种声学场景的录音组成,所有这些场景都有不同的录音位置。对于每个录音位置,都会捕获 3-5 分钟长的录音。然后将原始录音分成长度为 10 秒的片段。数据集分为开发数据集和评估数据集两部分发布,可以从Zenodo下载。
该数据集于 06/2015 至 01/2017 期间在芬兰收集,该集合已获得欧洲研究理事会的资助。
数据集中的声学场景 (15):
对于所有声学场景,录音都是在不同的地点捕获的:不同的街道、不同的公园、不同的家庭。使用?Soundman OKM II Klassik/studio A3、驻极体双耳麦克风和?Roland Edirol R-09?录音机进行录音,采用 44.1 kHz 采样率和 24 位分辨率。麦克风经过专门设计,看起来像耳机,戴在耳朵上。因此,录制的音频与到达佩戴设备的人的人类听觉系统的声音非常相似。
记录数据的后处理涉及与记录个人隐私相关的方面。对于在私人场所录制的音频材料,必须获得所有相关人员的书面同意。在公共场所录制的材料不需要此类同意,但会进行内容筛选,并删除侵犯隐私的片段。
TAU Urban Acoustic Scenes 2020 Mobile, Development dataset
?原文不能收藏,转发,就写这里了:语音行业有什么好用的开源噪声库吗???????
????????????????目录
语音数据集
TIMIT
VCTK
AISHELL-ASR0009-OS1 开源中文语音数据库
Mozilla Common Voice
Tatoeba
日语数据集
气导骨导数据集
噪声数据集
noise-92
NOIZEUS数据集
DEMAND
PNL 100 Nonspeech Sounds
rnnoise_ontributions
COUGHVID 众包数据集
ESC-50:环境声音分类数据集
ESC环境噪音分类数据集
DESED dataset
DISCO
婴儿啼哭数据集
风噪数据集
YouTube--ASMR noise
FSD50K
MS-SNSD
QUT-NOISE
freesound-datasets
STARSS22:Sony-TAu Realistic Spatial Soundscapes 2022
VOICe Dataset
In-Vehicle Noise Dataset
Vehicle Interior Sound Dataset
MAVD交通数据集
Dataset-AOB:城市声音事件分类
CHiME-Home
UrbanSound
UrbanSound8K
SONYC Urban Sound Tagging
Isolated urban sound database
Acoustic Event Dataset
BBC音效
NAR 数据集
asr-noises
音乐数据集
DCASE
综合数据集
MUSAN
FSDnoisy18k
DS_10283_2791
CSTR NAM TIMIT Plus
参考
语音行业有什么好用的开源噪声库吗?
像是asr asv等等领域,我们经常要用噪声来做数据增强提升模型鲁棒性,那么有什么好用的开源噪声库吗?
我最喜欢用的就是openslr里面录制的混响和加性噪声~
混响的:http://www.openslr.org/resources/28/rirs_noises.zip
这个混响包含了real和simulated,用的比较多是simulated中的小房间中房间,对应房间大小分别是1~10m和10~30m
加性的:http://www.openslr.org/resources/17/musan.tar.gz
这个加性包含人声babble,音乐背景声和真实噪声。这两个噪声库强烈推荐Mark上~
另外就是用sox改改音速和音量,这些dither也可以纳入考虑
发布于 2019-03-25 12:29
?赞同 37??15 条评论?分享
?收藏?喜欢?
传统的开源噪声库有:
NOISEX-92
DEMAND
CHIME CHELLENGE里的噪声源
以上都是专门针对噪声鲁棒性训练和评价设计的噪声库。缺点是都比较小。
还有其他两个option:
~ 可以试试训练声音事件分类器用的数据集,比如AudioSet,数据很大。
~ 或者花钱买电影音效库,比如bbc什么的。数据很多,质量高。就是不便宜。
————————————————————
我用的不算专用的噪音库,是一个声学场景分类的噪音,场景比较多,但是不是非常符合噪音这个范畴,可以用来做aec。
TUT dataset:
Acoustic scenes for the task (15):
有个可推荐的,不仅仅是噪声。
sox。SOund eXchange lib。
是个音频特效库。包括回声,变调,变速,带通等等。
但噪声方面比较弱,只自带了各种波形的发生器,自然环境噪声需要自己搜集一些音频文件。
最大的缺点是只能用文件到文件的模式处理音频,使用tmpfs可以有效缓解这个问题。