Skip to content

diarization(说话人日志)模型优化相关 #252

@joshpr

Description

@joshpr

diarization应该大致可以分成segmentation,embedding,clustering,后处理这么几个部分,如果要优化效果的话(降低DER),可以从哪些方面入手呢?
想到的一些措施:
1、训练segmentation(用的pyannote-segmentation 3.0)
2、训练embedding(用这个项目里提供的训练工具)
3、调整clustering
想请教一下,哪一块比较推荐优先尝试呢?
另外,如果调整了segmentation模型或者是embedding模型,clustering的参数是不是也要进行相应的调整?本项目有提供自动化调参脚本吗?还是需要自己试or开发?

钉钉群过期,能帮忙更新一下吗,想进群讨论。
感谢开源。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions