-
Notifications
You must be signed in to change notification settings - Fork 33
Open
Description
チケットのゴール
- 現在は抽出データに対して音声認識を適用し、文字誤り率
CER<=0.33を満たす発話のみで学習を行っている。- 抽出データの合計時間数は最初のリリース時点で49121時間。
- うち、
CER<=0.33を満たす発話は19039時間(38.7%) - 詳細な分布は以下のヒストグラムを参照。
- 一定の基準で足切りするのではなく、CERをタグとして学習データに組み込む。
- CERの高い(ノイズの大きい)データも学習に取り込めるようになる。
- 従来の方式に比べて頑健なモデルが得られる可能性がある。
- この方式を検証し、精度・ロバストネスが改善するか確認する。
参考: 抽出データのCER分布(49121時間)
Reactions are currently unavailable
Metadata
Metadata
Assignees
Labels
No labels
