Skip to content

建议:使用 FunASR/SenseVoice 提升字幕生成速度和准确率 #364

@LauraGPT

Description

@LauraGPT

功能建议

bilive 做 B 站直播录制和自动字幕,建议集成 FunASR/SenseVoice 提升 ASR 性能。

优势

  • 实时流式识别:FunASR 提供 WebSocket 流式服务,适合直播场景
  • 中文识别准确:Paraformer 中文准确率优于 Whisper
  • 速度极快:非自回归架构,GPU 推理 170 倍实时
  • 内置标点:自动添加标点,弹幕/字幕质量更好
  • 内置 VAD:自动语音活动检测

流式服务

# 启动 WebSocket 流式 ASR 服务
python -m funasr.bin.ws_server --device cuda
# WebSocket 地址: ws://localhost:10095

离线批量处理

from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="clip.wav")

FunASR 同时支持流式(直播实时字幕)和离线(录播后处理)两种模式,很适合 bilive 的使用场景。

如有兴趣,欢迎交流!

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions