Releases: neon9809/density-aware
Releases · neon9809/density-aware
v2.0.0 - 立体声支持、音频质量控制和严格相对位置模式
稠密感知快放算法 v2.0.0 发布
🎉 主要新功能
🔊 完整音频质量控制
- 立体声支持:保持原始声道数,不再强制转换为单声道
- 采样率控制:自定义输出采样率(44100Hz、48000Hz 等)
- 位深控制:支持 8/16/24/32 bit 位深
- 格式选择:WAV 无损输出或 MP3 有损压缩
- MP3 码率:可选 128k/192k/256k/320k
📍 严格相对位置模式
专为短视频平台和剪辑软件集成设计:
- 语音片段的相对位置严格按倍速缩放
- 保持首尾静音的比例关系,确保与画面同步
- 允许从静音"借用"时间优化语音听感
- 适用于需要音画同步的视频快放场景
🎨 全新 Web 界面
- 上传后自动开始分析
- 分析期间禁用处理按钮和高级选项
- 处理按钮点击后变为进度条
- 两种音质模式:快速预览 / 原文件音质
📚 文档改进
- 新增详细算法文档
About_Algorithm.md - 包含完整的处理流程管道图(普通模式 vs 严格相对位置模式)
- 详尽的数学原理推导和代码实现解析
🎵 音频样本
提供实际处理效果对比:
- 原始音频(豆包生成)
- 普通模式处理结果
- 严格相对位置模式处理结果
☁️ 云平台部署
新增一键部署支持:
- Railway 一键部署
- Render 一键部署
🐛 Bug 修复
- 修复 pyrubberband 数据类型转换问题(归一化处理)
- 修复输出音频无声的问题
📝 技术细节
严格相对位置模式的数学原理
- 所有片段初始速度设定为基准倍速 R
- 语音片段可从相邻静音片段"借用"时间
- 确保语音片段中点位置严格按
新位置 = 原位置 / 倍速缩放
参数推荐策略
- 普通模式:优先保留语音清晰度
- 严格模式:保持时间轴线性缩放
🚀 快速开始
云平台部署(最简单)
点击 README 中的 Railway 或 Render 部署按钮
Docker 部署
docker run -d -p 8000:8000 ghcr.io/neon9809/density-aware:latest本地部署
详见 README 中的本地部署说明
📖 更多信息
- GitHub: https://github.com/neon9809/density-aware
- 算法文档: https://github.com/neon9809/density-aware/blob/main/About_Algorithm.md
- 许可证: MIT
感谢使用稠密感知快放算法!