哪里可以找到语音数据集?

个人网站收藏管理页面如下 每个数据集的详细介绍如下 openslr.org清华大学30小时中文语音库。THCHS-30是在安静的办公室环境下,通过单个碳粒麦克风录取的,总时长超过30个小时。大部分参与录音的人员是会说流利普通话的大学生。采样频率16kHz,采样大小16bits。THCHS-30的文本选取自大容量的新闻,目的是为了扩充863语音库

AIBigKaldi(十一)| Kaldi的三音子模型训练(上)(源码解析...

以Kaldi的thchs30数据集为例,我们主要解析train_deltas.sh脚本中的相关源码。1. 需要的文件 alidir/final.mdl:单音素模型的最终GMM参数。$alidir/ali.1.gz:单音素...

干货| 15个国内常用语料库,建议收藏

清华TH语料库(THCHS-30语料库)简介:原清华TH语料库于1994年建成,后经过升级和更新,更名为THCHS-30语料库。总库采用分级管理原则,分为生语料和熟语料两大类。网址:...

ASRPRO语音识别准确率低如何优化? - 编程语言 - CSDN问答

ASRPRO语音识别准确率低的常见技术问题之一是麦克风采集信号质量差。由于ASRPRO芯片对输入音频信噪比敏感,若前端麦克风灵敏度不足、增益设置不当或...

heygem - asr识别准确率低?如何优化模型训练数据 - 编程...

同时引入数据增强技术(如SpecAugment、声音混响模拟)和领域自适应策略,可有效提升heygem-asr在复杂环境下的识别鲁棒性与整体准确率。使用PaddlePad...

数据分析和挖掘有哪些公开的数据来源?

//pan.baidu.com/s/1pLuckwNanqhCaltech 10k Web Faces 人脸图像数据 135.42 Mbhttps://pan.baidu.com/s/1gfP03azr6THCHS-30 汉语语音...

我见物联多妩媚!物联网联盟会员风采系列之(二)

在Aishell和清华大学语音Thchs30测试集上,将字错率第一遍WFST解码以及第二遍RNN重打分结果分别相对降低21.7%和10.3%。TCP/IP堆栈缺陷曝光:Forescout...

语言学系大学生务必收藏的15个国内常用语料库

清华TH语料库(THCHS-30语料库)链接:http://www.openslr.org/18 介绍:清华TH语料库于1994年建成,总库分为生语料和熟语料两大类。近年来不断...

中文语料库有哪些

17 THCHS-30 清华大学大学生30小时语音 18 数据下载 - BosonNLP 19 北京宇音天下科技有限公司-下载中心 20 水木社区-源于清华的高知社群 21 语料库 - 自然语言处理与...

研一刚接触语音识别,怎么运用kaldi工具箱做一个...

Kaldi大部分样例的数据是收费或不公开的,公开的数据包括:英文:librispeech,tedlium,ami中文:thchs30你目前的情况比较适合用thchs30,因为你的...

相关搜索