功能建议
bilive 做 B 站直播录制和自动字幕,建议集成 FunASR/SenseVoice 提升 ASR 性能。
优势
- 实时流式识别:FunASR 提供 WebSocket 流式服务,适合直播场景
- 中文识别准确:Paraformer 中文准确率优于 Whisper
- 速度极快:非自回归架构,GPU 推理 170 倍实时
- 内置标点:自动添加标点,弹幕/字幕质量更好
- 内置 VAD:自动语音活动检测
流式服务
# 启动 WebSocket 流式 ASR 服务
python -m funasr.bin.ws_server --device cuda
# WebSocket 地址: ws://localhost:10095
离线批量处理
from funasr import AutoModel
model = AutoModel(model="iic/SenseVoiceSmall")
result = model.generate(input="clip.wav")
FunASR 同时支持流式(直播实时字幕)和离线(录播后处理)两种模式,很适合 bilive 的使用场景。
如有兴趣,欢迎交流!
功能建议
bilive 做 B 站直播录制和自动字幕,建议集成 FunASR/SenseVoice 提升 ASR 性能。
优势
流式服务
离线批量处理
FunASR 同时支持流式(直播实时字幕)和离线(录播后处理)两种模式,很适合 bilive 的使用场景。
如有兴趣,欢迎交流!