thchs

如何用Kaldi做语音识别?

编译 kaldi 代码使用命令：cd srcmake depend./configure --shared --use-cuda=yes –cudatk-dir=/usr/local/cuda-12.2make -j 44. thchs30 环境及数据准备A、更改训练脚本进入 kaldi/egs/thchs30/s5 目录，主要是更改cmd.sh、path.sh、run.sh文件

哪里可以找到语音数据集?

openslr.org清华大学30小时中文语音库。THCHS-30是在安静的办公室环境下，通过单个碳粒麦克风录取的，总时长超过30个小时。大部分参与录音的人员...

语言学系大学生务必收藏的15个国内常用语料库

清华TH语料库（THCHS-30语料库）链接：http://www.openslr.org/18 介绍：清华TH语料库于1994年建成，总库分为生语料和熟语料两大类。近年来不断升...

干货| 15个国内常用语料库,建议收藏

清华TH语料库（THCHS-30语料库）简介：原清华TH语料库于1994年建成，后经过升级和更新，更名为THCHS-30语料库。总库采用分级管理原则，分为生语料和熟语料两大类。网址：...

Vosk识别准确率低,如何优化模型与音频预处理? - 编程...

五,验证层:量化评估与ab测试基准测试集:采用thchs-30 +自建医疗问诊语料(200小时,含12类方言); 指标体系:wer(词错误率),ter(术语召回率)...

有哪些主流开源数据集平台? - ZOL问答

(aishell、thchs-30)、小样本学习(fewclue)、情感分析(chnsenticorp)、命名实体识别(msra-ner、weibo-ner)、中文分词(pku、msr、ctb)、语义解析(dusql)、信息抽取(duie)、搜索匹配(...

如何设置一个好记的密码 - 百度经验

比如说，“eat the cheeseburger（吃汉堡）”可以变成“tthchsbrgr（分别将‘eat’的‘ea’、‘the’...

AIBigKaldi(十一)| Kaldi的三音子模型训练(上)(源码解析...

以Kaldi的thchs30数据集为例，我们主要解析train_deltas.sh脚本中的相关源码。1. 需要的文件 alidir/final.mdl：单音素模型的最终GMM参数。$...

中文语料库有哪些

17 THCHS-30 清华大学大学生30小时语音 18 数据下载 - BosonNLP 19 北京宇音天下科技有限公司-下载中心 20 水木社区-源于清华的高知社群 21 语料库 - 自然语言处理与...

ASR领域的预训练模型有哪些?

vosk-model-cn-0.221.3G13.98 (SpeechIO-02) 27.30 (SpeechIO-06) 7.43 (THCHS)Big generic Chinese model for server processingApache ...