北京信息科学与技术国家研究中心

Beijing National Research Center for Information Science and Technology

中国明星声纹库CN-Celeb Kaldi Recipe发布

12月14日,信息国家研究中心智能科学研究部语音和语言技术团队在语音开源平台Kaldi上公布了中国明星声纹数据集CN-Celeb的说话人识别基础流程(Recipe)。研究者可以依此流程构建属于自己的说话人识别系统。

CN-Celeb是由语音和语言技术团队近日公布的一个中国明星声纹库。项目组成员包括实习生范悦、亢嘉文、李开诚、陈浩林、程思潼、张鹏远、周子雅等(指导老师王东、李蓝天、蔡云麒)。该声纹库包含1,000名中国明星(包括歌星、影星、说唱艺人等)在采访、歌舞及影视作品中的声音片段。每位明星的声音时长大约20分钟,整个数据集近300小时。该数据包含了11类实际场景,覆盖了噪音、信道、发音方式等各方面的复杂性,特别适合研究复杂场景下的说话人识别技术。研究者可在共享资源网站http://openslr.org搜索CN-Celeb免费下载。

Kaldi是语音领域最活跃的开源平台,由著名学者Dan Povey发起并维护,吸引了众多研究者参与开发。目前,Kaldi中已经有语音识别、说话人识别、语种识别等标准Recipe近90个。基于CN-Celeb数据库,语音和语言技术团队近日提交了一份说话人识别Recipe,并于今日Merge 到Main Branch中。这是第一份中文说话人识别的Kaldi Recipe。研究者可以通过下载最新的Kaldi系统进行实验验证。

基于 CN-Celeb 的 Kaldi Recipe