Skip to content

Commit 641be60

Browse files
committed
feat: 新增人设冲突检测与三级拦截策略
- 集成 PersonaMatcher 实现人设一致性检测,支持 block/revise/suggest 三级策略 - 新增临时观察模式切换指令,支持自动恢复拦截模式 - WebUI 增加筛选功能与 CSV 导出端点 - 默认防护模式改为 intercept,扩展日志字段包含人设检测信息 - 版本号升级至 v3.4.0
1 parent 150c352 commit 641be60

File tree

4 files changed

+493
-23
lines changed

4 files changed

+493
-23
lines changed

README.md

Lines changed: 12 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -12,21 +12,19 @@
1212
1313
---
1414

15-
## ✨ v3.3 亮点
15+
## ✨ v3.4 亮点
1616

17-
- **PTD 3.0 引擎**:全面升级检测能力——在 2.3 的编码识别基础上新增执行链与外链协同加权;加入 `PowerShell -enc``certutil -decode``bitsadmin /transfer`、函数调用结构等高危特征识别;对“编码+执行”“外链+命令拉取”共现进行额外加权,提升复合攻击拦截率。
18-
- **版本一致性与可见性**:统一插件版本常量并在 WebUI 安全总览与登录页显示插件版本与 PTD 核心版本;`metadata.yaml` 与插件注册版本同步至 `v3.3.0` / `3.3.0`
19-
- **LLM 安全审计**:在神盾 / 焦土 / 拦截模式下生成结构化 JSON 判定(是否注入、置信度、原因)。
20-
- **自动黑白名单**:启发式与 LLM 均可触发封禁,支持永久 / 定时封禁,并提供指令 / WebUI 双向维护。
21-
- **明暗主题 WebUI**:密码登录 + 会话超时 + 明暗主题切换,实时展示核心状态、拦截统计、分析日志(含版本信息)。
22-
- **端口智能回退**:监听端口被占用时自动尝试备用端口并更新配置,避免 WebUI 启动失败。
23-
- **可配置审查 LLM**:支持设置审查供应商与模型,未配置时回退至默认 Provider/模型。
24-
- **防骚扰检测**:新增性骚扰/辱骂/霸凌检测信号与拦截策略,可在 WebUI 或指令中开关。
25-
26-
> 官方展示页:`site/index.html`
17+
- **人设冲突检测**:集成 `persona_core``PersonaMatcher`,新增 `persona_enabled` / `persona_sensitivity` 配置;在分析日志中记录 `persona_action``persona_score``persona_reason`,并与核心严重级别协同映射为拦截动作。
18+
- **三级拦截策略**:在拦截模式下根据人设动作与风险级别执行 `block / revise / suggest` 三级策略,进一步提升可控性与可解释性。
19+
- **观察模式临时切换**:新增指令 `切换观察模式 <分钟>`,可临时切至哨兵模式,倒计时结束后自动恢复拦截模式,便于灰度与问题定位。
20+
- **WebUI 筛选与导出**:仪表盘新增筛选区块,支持按用户/群/严重级别/触发/动作/关键词/时间范围筛选;新增导出端点 `/export/incidents.csv``/export/analysis.csv`,导出数据包含动作与人设字段。
21+
- **日志字段扩展**:拦截事件与分析日志新增 `action_taken` 字段;分析日志新增人设相关字段,便于审计与追溯。
22+
- **默认防护模式**:默认模式调整为 `intercept`(拦截模式),更贴近审计与合规要求。
23+
- **版本号**:插件版本升级至 `v3.4.0`
2724

2825
---
2926

27+
3028
## 🛡️ 四象防御模式
3129

3230
| 模式 | 标签 | 特性 | 推荐场景 |
@@ -45,7 +43,8 @@
4543
- 快捷操作:快速切换模式、启停 LLM、清空拦截/日志数据。
4644
- 审查设置:在仪表盘直接配置审查 `供应商/模型`,并一键开启/关闭防骚扰检测。
4745
- 名单管理:黑白名单增删、剩余封禁时长显示。
48-
- 实时审计:拦截事件 + 分析日志记录命中规则、得分、触发源。
46+
- 实时审计:拦截事件 + 分析日志记录命中规则、得分、触发源;导出数据包含 `action_taken` 与人设相关字段。
47+
- 筛选与导出:支持按用户/群/严重级别/触发/动作/关键词/时间范围筛选,并导出 CSV(`/export/incidents.csv``/export/analysis.csv`)。
4948

5049
访问 `http://127.0.0.1:18888`,如端口被占用会自动改用备选端口并在日志提示。
5150

@@ -58,6 +57,7 @@
5857
| `/反注入帮助` | 全员 | 查看全部指令 |
5958
| `/反注入统计` | 管理员 / 白名单 | 输出启发式、LLM 命中与自动封禁统计 |
6059
| `/切换防护模式` | 管理员 | 在四种模式间轮换 |
60+
| `切换观察模式 <分钟>` | 管理员 | 临时切为哨兵模式,结束后自动恢复拦截 |
6161
| `/LLM分析状态` | 管理员 | 输出当前模式 / LLM 配置示意图 |
6262
| `/开启LLM注入分析` | 管理员 | LLM 复核切换为活跃 |
6363
| `/关闭LLM注入分析` | 管理员 | 关闭 LLM 复核 |

0 commit comments

Comments
 (0)