曦曦のblog

Tag: HTK

实验:建立五个词的识别系统(步骤以及结果显示)

by tracylling on 四.14, 2010, under 语音识别

(PS:只作为尝试,不保证正确)

系统简介:

HTK是隐马尔可夫模型工具箱,由剑桥大学工程系研发而成。该工具箱的目的是搭建使用隐马尔可夫模型。

详见:http://htk.eng.cam.ac.uk/

搭建步骤:

a)      训练库创建:词汇集中的每个元素进行多次录制,且对相应词汇做好标签;

b)      声学分析:将波形数据文件转换为一系列系数向量;

c)      模型定义:为总词汇集中的每个元素定义一个HMM原型;

d)      模型训练:使用训练数据对每个HMM模型进行初始化、训练;

e)      任务定义:识别系统的语法(什么可被识别)的定义;

f)       未知输入信号识别;

g)      评估:识别系统的性能可通过测试数据进行评估。

工作环境构建:

创建如下目录结构:

a)      data/:存储训练和测试数据(语音信号、标签等等) ,包括2个子目录,data/train/和 data/test/,用来区分识别系统的训练数据和评估数据;

b)      analysis/:存储声学分析步骤的文件;

c)      training/:存储初始化和训练步骤的相关文件;

d)      model/:存储识别系统的模型(HMMs)的相关文件;

e)      def/:存储任务定义的相关文件;

f)       test/:存储测试相关文件。

后期要建立的几个文件:analysis.conf   targetlist.txt  hmmlist.txt   trainlist.txt

过程:

1、  建立训练资料

a. 录制音频
HSLab name.sig
b. 标记信号
在HSLab中标记信号位置

(continue reading…)

Leave a Comment :, , more...

Looking for something?

Use the form below to search the site:

Still not finding what you're looking for? Drop a comment on a post or contact us so we can take care of it!

Visit our friends!

A few highly recommended friends...

    Archives

    All entries, chronologically...