本文件记录项目的所有重要变更。格式基于 Keep a Changelog。
- 项目工程化:添加 CONTRIBUTING.md、CODE_OF_CONDUCT.md、SECURITY.md
- 添加 GitHub Issue / PR 模板
- 添加 CI 自动化验证(数据格式校验、重复检测)
- 添加数据验证脚本
scripts/validate.py - 添加多语言使用示例(Python、Java、Go、Node.js)
- 完善 README:添加徽章、详细说明、使用示例、项目结构
- 补全 LICENSE 中的版权信息
- 色情类敏感词库(~300 条)
- 政治类敏感词库(~325 条)
- 广告类敏感词库(~120 条)
- 涉枪涉爆违法信息关键词库(~430 条)
- 违规网址黑名单(~14,500 条)
- 中文通用停止词库(~1,890 条)