Skip to content

Releases: neon9809/density-aware

v2.0.0 - 立体声支持、音频质量控制和严格相对位置模式

06 Jan 00:24

Choose a tag to compare

稠密感知快放算法 v2.0.0 发布

🎉 主要新功能

🔊 完整音频质量控制

  • 立体声支持:保持原始声道数,不再强制转换为单声道
  • 采样率控制:自定义输出采样率(44100Hz、48000Hz 等)
  • 位深控制:支持 8/16/24/32 bit 位深
  • 格式选择:WAV 无损输出或 MP3 有损压缩
  • MP3 码率:可选 128k/192k/256k/320k

📍 严格相对位置模式

专为短视频平台和剪辑软件集成设计:

  • 语音片段的相对位置严格按倍速缩放
  • 保持首尾静音的比例关系,确保与画面同步
  • 允许从静音"借用"时间优化语音听感
  • 适用于需要音画同步的视频快放场景

🎨 全新 Web 界面

  • 上传后自动开始分析
  • 分析期间禁用处理按钮和高级选项
  • 处理按钮点击后变为进度条
  • 两种音质模式:快速预览 / 原文件音质

📚 文档改进

  • 新增详细算法文档 About_Algorithm.md
  • 包含完整的处理流程管道图(普通模式 vs 严格相对位置模式)
  • 详尽的数学原理推导和代码实现解析

🎵 音频样本

提供实际处理效果对比:

  • 原始音频(豆包生成)
  • 普通模式处理结果
  • 严格相对位置模式处理结果

☁️ 云平台部署

新增一键部署支持:

  • Railway 一键部署
  • Render 一键部署

🐛 Bug 修复

  • 修复 pyrubberband 数据类型转换问题(归一化处理)
  • 修复输出音频无声的问题

📝 技术细节

严格相对位置模式的数学原理

  • 所有片段初始速度设定为基准倍速 R
  • 语音片段可从相邻静音片段"借用"时间
  • 确保语音片段中点位置严格按 新位置 = 原位置 / 倍速 缩放

参数推荐策略

  • 普通模式:优先保留语音清晰度
  • 严格模式:保持时间轴线性缩放

🚀 快速开始

云平台部署(最简单)

点击 README 中的 Railway 或 Render 部署按钮

Docker 部署

docker run -d -p 8000:8000 ghcr.io/neon9809/density-aware:latest

本地部署

详见 README 中的本地部署说明

📖 更多信息


感谢使用稠密感知快放算法!