Tag: HTK
实验:建立五个词的识别系统(步骤以及结果显示)
by tracylling on 四.14, 2010, under 语音识别
(PS:只作为尝试,不保证正确)
系统简介:
HTK是隐马尔可夫模型工具箱,由剑桥大学工程系研发而成。该工具箱的目的是搭建使用隐马尔可夫模型。
搭建步骤:
a) 训练库创建:词汇集中的每个元素进行多次录制,且对相应词汇做好标签;
b) 声学分析:将波形数据文件转换为一系列系数向量;
c) 模型定义:为总词汇集中的每个元素定义一个HMM原型;
d) 模型训练:使用训练数据对每个HMM模型进行初始化、训练;
e) 任务定义:识别系统的语法(什么可被识别)的定义;
f) 未知输入信号识别;
g) 评估:识别系统的性能可通过测试数据进行评估。
工作环境构建:
创建如下目录结构:
a) data/:存储训练和测试数据(语音信号、标签等等) ,包括2个子目录,data/train/和 data/test/,用来区分识别系统的训练数据和评估数据;
b) analysis/:存储声学分析步骤的文件;
c) training/:存储初始化和训练步骤的相关文件;
d) model/:存储识别系统的模型(HMMs)的相关文件;
e) def/:存储任务定义的相关文件;
f) test/:存储测试相关文件。
后期要建立的几个文件:analysis.conf targetlist.txt hmmlist.txt trainlist.txt
过程:
1、 建立训练资料
a. 录制音频
HSLab name.sig
b. 标记信号
在HSLab中标记信号位置