Skip to content

ccall19/audioCls

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

音频分析系统

这是一个基于 FastAPI 和深度学习模型的音频分析系统,可以分析音频文件并检测是否存在报警信号。

功能特点

  • 上传音频文件(支持 .wav, .mp3, .ogg 格式)
  • 使用子序列模型分析音频
  • 显示详细的时间窗口分析结果
  • 直观的用户界面,展示分析结果

系统要求

  • Python 3.8+
  • PyTorch
  • FastAPI
  • Uvicorn
  • Librosa
  • Numpy

安装依赖

pip install fastapi uvicorn python-multipart torch librosa numpy pyyaml

运行应用

确保您已经在项目目录中设置了正确的模型路径(在 audio_analysis_app.py 中):

pkg_rootdir = "/mnt/d/repo/time/TimeGlm/"  # 修改为您的模型路径

然后运行服务器:

python audio_analysis_app.py

在浏览器中访问:http://127.0.0.1:8080

使用说明

  1. 点击"选择文件"按钮或将音频文件拖放到指定区域
  2. 点击"分析音频"按钮
  3. 等待分析完成,查看结果
    • 总体结果(报警触发/环境)
    • 报警片段数量
    • 音频时长
    • 详细的时间窗口分析结果

技术架构

  • 后端: FastAPI
  • 前端: HTML, CSS, JavaScript
  • 模型: 子序列时间序列分析模型

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors