中文语音识别训练,使用3层cnn+多层bilstm实现。使用lmdb存放音频特征MFCC,调用caffe 的函数在存放到lmdb里面做个矩阵转换。交叉熵损失函数和ctc_loss都做了尝试。训练集为清语音集。一个特征对应一个单字。
-
Notifications
You must be signed in to change notification settings - Fork 0
cnfive/speech
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
中文语音识别训练,使用3层cnn+多层bilstm实现。
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published