这是一个基于 FastAPI 和深度学习模型的音频分析系统,可以分析音频文件并检测是否存在报警信号。
- 上传音频文件(支持 .wav, .mp3, .ogg 格式)
- 使用子序列模型分析音频
- 显示详细的时间窗口分析结果
- 直观的用户界面,展示分析结果
- Python 3.8+
- PyTorch
- FastAPI
- Uvicorn
- Librosa
- Numpy
pip install fastapi uvicorn python-multipart torch librosa numpy pyyaml确保您已经在项目目录中设置了正确的模型路径(在 audio_analysis_app.py 中):
pkg_rootdir = "/mnt/d/repo/time/TimeGlm/" # 修改为您的模型路径然后运行服务器:
python audio_analysis_app.py在浏览器中访问:http://127.0.0.1:8080
- 点击"选择文件"按钮或将音频文件拖放到指定区域
- 点击"分析音频"按钮
- 等待分析完成,查看结果
- 总体结果(报警触发/环境)
- 报警片段数量
- 音频时长
- 详细的时间窗口分析结果
- 后端: FastAPI
- 前端: HTML, CSS, JavaScript
- 模型: 子序列时间序列分析模型