Skip to content

按照脚本训练流程问题 #52

@KIP1024

Description

@KIP1024

1 我先是按照下载方式中通过魔塔社区下载的数据集,它是自动就给分好train、test等音频数据集,还有一个json文件与切分数据集的名称对应
2 stage 0这一步骤(wenetspeech_data_prep.sh),准备数据部分出现问题,我是把下载数据的json文件放在对应的路径下(但我总感觉不是这个json文件,这个只是对应划分训练集的),执行到下面 3 这个代码时候出现 4 的报错。求解!!没找到有写训练流程的教程。
3 # Files to be created:

wav.scp text segments utt2dur

python3 local/extract_meta.py
$wenetspeech_dir/WenetSpeech.json $corpus_dir || exit 1;

4
Traceback (most recent call last):
File "local/extract_meta.py", line 102, in
main()
File "local/extract_meta.py", line 98, in main
meta_analysis(args.input_json, args.output_dir)
File "local/extract_meta.py", line 47, in meta_analysis
if json_data['audio'] is not None:
KeyError: 'audio'

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions