GitHub - r50206v/COMSE6998-Speech-Recognition

need kaldi & montreal forced aligner
should create folders in root directory: org_audio, segmented_audio, train-result
run bash pipeline-train.sh
the model will be zip in model.zip in the root directory
run bash pipeline-test.sh

background music: piano music played by Tim Shevlyakov

country music: Mama tried

note lexicon dictionary comes from kaldi/egs/tedlium/s5_r3/data/local/lang_nosp/align_lexicon.txt

note kaldi-scp/*.scp comes from kaldi/egs/tedlium/s5_r3/data/train, kaldi/egs/tedlium/s5_r3/data/test, and kaldi/egs/tedlium/s5_r3/data/dev

note text comes from kaldi/egs/tedlium/s5_r3/data/train/text, kaldi/egs/tedlium/s5_r3/data/dev/text, and kaldi/egs/tedlium/s5_r3/data/test/text

note only partial data (under org_audio, segmented_audio, train-result and text) are uploaded, please use run kaldi/egs/tedlium/s5_r3/run.sh to get the full dataset, and run prepare_convert_to_wav.py to convert wav from sph files

Name		Name	Last commit message	Last commit date
Latest commit History 28 Commits
kaldi-scp		kaldi-scp
org_audio		org_audio
plots		plots
segmented_audio		segmented_audio
train-result		train-result
unfinished		unfinished
README.md		README.md
background.wav		background.wav
convert_to_wav.scp		convert_to_wav.scp
log.txt		log.txt
model.zip		model.zip
pipeline-train.sh		pipeline-train.sh
prepare_convert_to_wav.py		prepare_convert_to_wav.py
prepare_data.py		prepare_data.py
python-requirements.txt		python-requirements.txt
text		text

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Uh oh!

Releases

Packages

Uh oh!

Languages

r50206v/COMSE6998-Speech-Recognition

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages