astrbot_plugin_speech_censorship/main.py at master · HunYuan2333/astrbot_plugin_speech_censorship · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
"""群聊消息审核与自动禁言插件 - 主模块

这是简化后的主插件文件，负责：
1. 事件监听和路由
2. 模块之间的协调
3. 触发条件判断和定时任务管理
"""

import asyncio
import copy
import shlex
import time
from collections import deque
from pathlib import Path
from typing import Any, Deque, Dict, List, Optional, Set, Tuple

from astrbot.api import AstrBotConfig, logger
from astrbot.api.event import filter, AstrMessageEvent
from astrbot.api.star import Context, Star, StarTools

from .message_buffer import MessageBuffer
from .llm_analyzer import LLMAnalyzer
from .violation_manager import ViolationManager
from .ban_executor import BanExecutor
from .repositories import SlangRepository, SlangCandidateRepository
from .services import HybridRetriever, ReviewContextBuilder
from .models.slang_entry import GLOBAL_SCOPE


class SpeechCensorshipPlugin(Star):
    """群聊消息审核与自动禁言插件

    架构：
    - MessageBuffer: 消息缓冲管理
    - LLMAnalyzer: LLM 分析和响应解析
    - ViolationManager: 违规记录持久化
    - BanExecutor: 禁言执行和警告
    - SpeechCensorshipPlugin: 事件处理和业务协调
    """

    REQUIRED_JSON_FORMAT = (
        '{"violations":[{"user_id":"123456","reason":"阴阳怪气/争吵/敏感话题"}]}'
    )
    RETRY_QUEUE_MAX_DEFAULT = 500

    def __init__(self, context: Context, config: AstrBotConfig):
        super().__init__(context)
        self.context = context
        self.config = config

        # 模块初始化
        self.message_buffer = MessageBuffer()
        self.llm_analyzer = LLMAnalyzer(context)

        # 数据目录
        self.data_dir = self._get_data_dir()

        # 黑话词库与检索服务（并发安全仓储 + 混合检索）
        self.slang_repository = SlangRepository(self.data_dir)
        self.slang_candidate_repository = SlangCandidateRepository(self.data_dir)
        self.hybrid_retriever = HybridRetriever(self.slang_repository)
        self.review_context_builder = ReviewContextBuilder()

        # 违规管理器（延迟初始化在 initialize 中）
        self.violation_manager: Optional[ViolationManager] = None

        # 禁言执行器
        self.ban_executor = BanExecutor(
            self._try_get_aiocqhttp_event_class,
            self._get_config
        )

        # 定时检测任务
        self.timer_task: Optional[asyncio.Task] = None

        # 保存最新的 event 对象（用于发送消息和调用 API）
        self.latest_events: Dict[str, AstrMessageEvent] = {}
        self.latest_event_timestamps: Dict[str, float] = {}

        # 保护 latest_events 字典的锁
        self._events_dict_lock = asyncio.Lock()

        # 群组处理状态跟踪（防止重复处理）
        # 状态机：IDLE -> PROCESSING -> IDLE
        # 结构: {group_id: {"status": "IDLE"|"PROCESSING", "lock": asyncio.Lock}}
        self.group_processing_states: Dict[str, str] = {}
        self._processing_states_lock = asyncio.Lock()

        # 重试队列：用于存储失败需要重试的群组信息
        # 结构：[(group_id, messages_dict, retry_count, timestamp), ...]
        self.retry_queue: Deque[Tuple[str, Dict[str, List[Dict]], int, float]] = deque()
        self._retry_queue_lock = asyncio.Lock()
        self._retry_queue_max_size = int(
            self._get_config("retry_queue_max_size", self.RETRY_QUEUE_MAX_DEFAULT)
        )

        # 运行时配置缓存（避免高频消息路径中反复构建列表）
        self._whitelist_user_ids: Set[str] = set()
        self._enabled_group_ids: Set[str] = set()
        self._group_filter_enabled = False

        # 错误记录（用于 status 命令展示最近错误）
        self.last_errors: Dict[str, Dict[str, Any]] = {}
        self._last_errors_lock = asyncio.Lock()

        # 缓存的导入（用于防止平台耦合）
        self._aiocqhttp_event_class = None

        logger.info("群聊消息审核插件已加载")

    def _get_config(self, key: str, default: Any = None) -> Any:
        """获取插件配置"""
        return self.config.get(key, default)

    def _try_get_aiocqhttp_event_class(self):
        """延迟加载平台特定类，避免硬编码耦合"""
        if self._aiocqhttp_event_class is not None:
            return self._aiocqhttp_event_class

        try:
            from astrbot.core.platform.sources.aiocqhttp.aiocqhttp_message_event import AiocqhttpMessageEvent
            self._aiocqhttp_event_class = AiocqhttpMessageEvent
            return self._aiocqhttp_event_class
        except ImportError:
            logger.warning("无法导入 AiocqhttpMessageEvent，QQ平台特定功能将不可用")
            return None

    def _get_data_dir(self) -> Path:
        """获取数据保存目录（使用 AstrBot 的标准数据目录）

        必须遵循 AstrBot 框架标准：data/plugin_data/<plugin_name>
        """
        try:
            # 根据 AstrBot 框架规范，使用 StarTools.get_data_dir()
            data_dir = StarTools.get_data_dir()
            return Path(data_dir)
        except Exception as e:
            logger.error(f"获取数据目录失败: {e}")
            # 在极端情况下，仍然抛出异常而不是降级，以防止配置隐式失败
            raise

    async def _touch_latest_event(self, group_id: str, event: AstrMessageEvent):
        """更新群组最近事件引用及时间戳"""
        async with self._events_dict_lock:
            self.latest_events[group_id] = event
            self.latest_event_timestamps[group_id] = time.time()

    async def _get_latest_event(self, group_id: str) -> Optional[AstrMessageEvent]:
        """安全地获取群组的最新event"""
        async with self._events_dict_lock:
            return self.latest_events.get(group_id)

    async def _try_acquire_processing_lock(self, group_id: str) -> bool:
        """尝试获取群组的处理锁（防止重复处理）

        返回 True 表示成功获得锁，群组进入 PROCESSING 状态
        返回 False 表示群组已在处理中，需要跳过
        """
        async with self._processing_states_lock:
            if self.group_processing_states.get(group_id) == "PROCESSING":
                logger.warning(f"群 {group_id} 正在处理中，跳过本轮检测")
                return False

            self.group_processing_states[group_id] = "PROCESSING"
            return True

    async def _release_processing_lock(self, group_id: str):
        """释放群组的处理锁，恢复到 IDLE 状态"""
        async with self._processing_states_lock:
            self.group_processing_states[group_id] = "IDLE"

    async def _enqueue_retry(self, group_id: str, messages_dict: Dict, retry_count: int = 0):
        """将失败的消息加入重试队列

        Args:
            group_id: 群组 ID
            messages_dict: 消息字典
            retry_count: 已重试次数
        """
        max_retries = 3
        if retry_count >= max_retries:
            logger.warning(f"群 {group_id} 已达到最大重试次数({max_retries})，放弃处理")
            return

        async with self._retry_queue_lock:
            if len(self.retry_queue) >= self._retry_queue_max_size:
                dropped_group_id, _, _, _ = self.retry_queue.popleft()
                logger.warning(
                    f"重试队列已满（max={self._retry_queue_max_size}），已丢弃最旧项（群 {dropped_group_id}）"
                )

            # 入队副本，避免原对象在外部被修改后影响重试一致性
            queue_snapshot = copy.deepcopy(messages_dict)
            self.retry_queue.append((group_id, queue_snapshot, retry_count, time.time()))
            logger.info(f"群 {group_id} 消息已加入重试队列（重试次数: {retry_count}/3）")

    def _refresh_runtime_config_cache(self):
        """刷新运行时配置缓存（在初始化和周期任务中调用）。"""
        whitelist_users = self._get_config("whitelist_users", [])
        enabled_groups = self._get_config("enabled_groups", [])

        self._whitelist_user_ids = {str(user_id) for user_id in whitelist_users}
        self._enabled_group_ids = {str(group_id) for group_id in enabled_groups}
        self._group_filter_enabled = bool(self._enabled_group_ids)

    def _is_slang_feature_enabled(self) -> bool:
        """黑话功能总开关。关闭时不拼接任何黑话相关提示词。"""
        return bool(self._get_config("slang_feature_enabled", True))

    async def _build_retrieval_context(self, group_id: str, messages_dict: Dict[str, List[Dict]]) -> str:
        """构建检索增强上下文（失败时降级为空，不影响主链路）。"""
        if not self._is_slang_feature_enabled():
            return ""

        slang_detection_enabled = bool(self._get_config("slang_detection_enabled", True))
        if not slang_detection_enabled:
            return ""

        case_sensitive = bool(self._get_config("slang_match_case_sensitive", False))
        slang_max_hits = int(self._get_config("slang_max_hits", 12))

        try:
            hits = await self.hybrid_retriever.retrieve(
                group_id=group_id,
                messages_dict=messages_dict,
                case_sensitive=case_sensitive,
                max_hits=slang_max_hits,
            )
            return self.review_context_builder.build_slang_context(hits, max_items=slang_max_hits)
        except Exception as e:
            logger.error(f"构建检索增强上下文失败（将降级为空）: {e}", exc_info=True)
            return ""

    def _filter_candidate_slangs(self, candidates: List[Dict]) -> List[Dict]:
        """按置信度与数量限制筛选候选新黑话。"""
        if not self._is_slang_feature_enabled():
            return []

        if not candidates:
            return []

        min_confidence = float(self._get_config("candidate_min_confidence", 0.75))
        max_items = int(self._get_config("candidate_max_items", 5))

        filtered = []
        for candidate in candidates:
            term = str(candidate.get("term", "")).strip()
            if not term:
                continue

            confidence = float(candidate.get("confidence", 0.0) or 0.0)
            if len(term) <= 1:
                confidence *= 0.8

            if confidence < min_confidence:
                continue

            normalized = dict(candidate)
            normalized["confidence"] = round(confidence, 4)
            filtered.append(normalized)

        filtered.sort(key=lambda item: float(item.get("confidence", 0.0)), reverse=True)
        return filtered[: max(1, max_items)]

    async def _process_retry_queue(self):
        """处理重试队列中的消息

        用于定时任务中，处理之前失败需要重试的消息
        """
        if not self.retry_queue:
            return

        async with self._retry_queue_lock:
            items_to_process = self.retry_queue.copy()
            self.retry_queue.clear()

        logger.info(f"开始处理重试队列（{len(items_to_process)}项）")

        for group_id, messages_dict, retry_count, enqueue_time in items_to_process:
            try:
                # 增加重试计数
                new_retry_count = retry_count + 1
                logger.info(f"重试群 {group_id} 的消息分析（重试次数: {new_retry_count}/3）")

                # 重新处理这个群组的消息
                # 为了避免重复进入PROCESSING，我们不再设置处理状态，直接处理
                trigger_mode = self._get_config("trigger_mode", "hybrid")
                recent_limit = int(self._get_config("recent_message_limit", 50)) if trigger_mode == "strict_hybrid" else 0

                # 执行LLM分析
                try:
                    llm_provider = self._get_config("llm_provider", "")
                    if not llm_provider:
                        logger.warning(f"群 {group_id} 未配置 LLM 提供商，放弃重试")
                        continue

                    default_rules = self._get_config("default_review_rules", "")
                    custom_rules = self._get_config("custom_review_rules", "")
                    llm_api_timeout = float(self._get_config("llm_api_timeout", 30))
                    retrieval_context = await self._build_retrieval_context(group_id, messages_dict)
                    candidate_discovery_enabled = (
                        self._is_slang_feature_enabled()
                        and bool(self._get_config("candidate_discovery_enabled", True))
                    )
                    candidate_discovery_prompt = str(self._get_config("candidate_discovery_prompt", ""))
                    log_llm_response = bool(self._get_config("log_llm_response", False))

                    violations, suspected_slangs, error_code, should_retry = await self.llm_analyzer.analyze_messages(
                        group_id, messages_dict, llm_provider, default_rules, custom_rules,
                        llm_api_timeout=llm_api_timeout,
                        retrieval_context=retrieval_context,
                        candidate_discovery_enabled=candidate_discovery_enabled,
                        candidate_discovery_prompt=candidate_discovery_prompt,
                        log_response=log_llm_response,
                    )

                    if candidate_discovery_enabled and suspected_slangs:
                        filtered_candidates = self._filter_candidate_slangs(suspected_slangs)
                        if filtered_candidates:
                            await self.slang_candidate_repository.add_candidates(group_id, filtered_candidates)
                            logger.info(
                                f"群 {group_id} 已写入 {len(filtered_candidates)} 条候选新黑话（重试路径）"
                            )

                    # 重新检查重试条件
                    if error_code != "success":
                        # 记录错误信息
                        async with self._last_errors_lock:
                            self.last_errors[group_id] = {
                                "error_code": error_code,
                                "error_msg": f"重试失败: {error_code} (尝试 {new_retry_count + 1} 次)",
                                "timestamp": time.time()
                            }

                        if should_retry and new_retry_count < 3:
                            # 继续重试
                            await self._enqueue_retry(group_id, messages_dict, new_retry_count)
                        else:
                            # 放弃重试
                            logger.error(f"群 {group_id} 重试失败: error_code={error_code}，放弃处理")
                        continue

                    # 成功：执行禁言逻辑
                    if violations:
                        logger.info(f"重试成功：群 {group_id} 检测到 {len(violations)} 个违规用户")

                        for violation in violations:
                            user_id = violation.get("user_id")
                            reason = violation.get("reason", "违规内容")

                            if not user_id or not self.ban_executor.validate_and_should_ban(user_id, messages_dict, reason):
                                continue

                            if self.violation_manager and await self.violation_manager.check_repeated_violation_async(group_id, user_id):
                                continue

                            event = await self._get_latest_event(group_id)
                            if event and await self.ban_executor.ban_user(event, group_id, user_id, reason):
                                if self.violation_manager:
                                    await self.violation_manager.record_violation_async(group_id, user_id)

                        if self.violation_manager:
                            await self.violation_manager.save_records()
                    else:
                        logger.info(f"重试成功：群 {group_id} 无违规内容")

                except Exception as e:
                    logger.error(f"重试群 {group_id} 的分析失败: {e}", exc_info=True)
                    if new_retry_count < 3:
                        await self._enqueue_retry(group_id, messages_dict, new_retry_count)

            except Exception as e:
                logger.error(f"处理重试队列项失败: {e}", exc_info=True)

    async def initialize(self):
        """插件初始化：加载配置、启动定时任务"""
        self._refresh_runtime_config_cache()

        trigger_mode = self._get_config("trigger_mode", "hybrid")
        batch_size = self._get_config("batch_size", 10)
        llm_provider = self._get_config("llm_provider", "")

        # 初始化违规管理器并加载历史记录
        violation_cooldown_seconds = self._get_config("violation_cooldown_seconds", 3600)
        self.violation_manager = ViolationManager(self.data_dir, violation_cooldown_seconds)
        await self.violation_manager.load_records()

        # 初始化黑话词库
        await self.slang_repository.load()

        # 初始化候选新黑话词库
        await self.slang_candidate_repository.load()

        # 如果触发模式包含时间触发，启动定时器
        if trigger_mode in ["time_only", "hybrid", "strict_hybrid"]:
            self.timer_task = asyncio.create_task(self._periodic_check())
            check_interval = self._get_config("check_interval", 60)
            logger.info(f"定时检测任务已启动（间隔: {check_interval} 秒，模式: {trigger_mode}）")

        logger.info(
            f"当前配置：trigger_mode={trigger_mode}, batch_size={batch_size}, llm_provider={llm_provider or '未配置'}"
        )
        logger.info("群聊消息审核插件初始化完成")

    @filter.command("censor_status")
    async def censor_status(self, event: AstrMessageEvent):
        """查看当前审核配置状态"""
        trigger_mode = self._get_config("trigger_mode", "hybrid")
        check_interval = self._get_config("check_interval", 60)
        batch_size = self._get_config("batch_size", 10)
        recent_message_limit = self._get_config("recent_message_limit", 50)
        llm_provider = self._get_config("llm_provider", "")
        slang_feature_enabled = self._is_slang_feature_enabled()

        total_groups = len(self.message_buffer.buffer)
        total_messages = sum(
            sum(len(msgs) for msgs in users.values())
            for users in self.message_buffer.buffer.values()
        ) if total_groups > 0 else 0

        stats = await self.violation_manager.get_stats_async() if self.violation_manager else {}
        slang_stats = await self.slang_repository.get_stats()
        candidate_stats = await self.slang_candidate_repository.get_stats()

        # 获取最近的错误信息
        recent_error_msg = ""
        async with self._last_errors_lock:
            if self.last_errors:
                # 找出最近的错误
                latest_error = max(self.last_errors.items(), key=lambda x: x[1].get("timestamp", 0))
                group_id, error_info = latest_error
                error_code = error_info.get("error_code", "unknown")
                error_msg = error_info.get("error_msg", "")
                error_time = time.time() - error_info.get("timestamp", 0)

                # 根据 error_code 提供友好提示
                if error_code == "balance_insufficient":
                    recent_error_msg = f"\n\n⚠️ 最近错误（{int(error_time)}秒前）:\n💰 LLM API 余额不足，请充值后重新启用"
                elif error_code == "auth_error":
                    recent_error_msg = f"\n\n⚠️ 最近错误（{int(error_time)}秒前）:\n🔑 LLM API 认证失败，请检查 API Key 配置"
                elif error_code == "rate_limit":
                    recent_error_msg = f"\n\n⚠️ 最近错误（{int(error_time)}秒前）:\n⏱️ LLM API 速率限制，系统将自动重试"
                else:
                    recent_error_msg = f"\n\n⚠️ 最近错误（{int(error_time)}秒前）:\n{error_code}: {error_msg[:100]}"

        yield event.plain_result(
            "审核状态:\n"
            f"- trigger_mode: {trigger_mode}\n"
            f"- check_interval: {check_interval}\n"
            f"- batch_size: {batch_size}\n"
            f"- recent_message_limit: {recent_message_limit}\n"
            f"- llm_provider: {llm_provider or '未配置'}\n"
            f"- slang_feature_enabled: {slang_feature_enabled}\n"
            f"- buffer_groups: {total_groups}\n"
            f"- buffer_messages: {total_messages}\n"
            f"- violation_records: {stats.get('total_records', 0)}\n"
            f"- total_violations: {stats.get('total_violations', 0)}\n"
            f"- slang_entries: {slang_stats.get('total_entries', 0)}\n"
            f"- slang_active_entries: {slang_stats.get('active_entries', 0)}\n"
            f"- slang_candidates: {candidate_stats.get('total_candidates', 0)}\n"
            f"- pending_candidates: {candidate_stats.get('pending_candidates', 0)}"
            f"{recent_error_msg}"
        )

    @filter.command("censor_prompt_help")
    async def censor_prompt_help(self, event: AstrMessageEvent):
        """查看自定义提示词和JSON返回格式说明"""
        default_rules = self._get_config("default_review_rules", "")
        custom_rules = self._get_config("custom_review_rules", "")
        yield event.plain_result(
            "提示词说明:\n"
            "- 审核提示词由插件固定生成（含默认规则 + 你的自定义规则）\n"
            f"- default_review_rules: {'已配置' if default_rules.strip() else '未配置'}\n"
            f"- custom_review_rules: {'已配置' if custom_rules.strip() else '未配置'}\n"
            '- 你只需要填写"额外禁止什么"，不需要写提示词模板\n'
            "- 你不需要写 JSON 返回格式，插件会自动附加\n"
            "- LLM 必须严格返回 JSON，不要返回额外文字\n"
            f"- JSON 格式: {self.REQUIRED_JSON_FORMAT}"
        )

    @filter.permission_type(filter.PermissionType.ADMIN)
    @filter.command("censor_force_check")
    async def censor_force_check(self, event: AstrMessageEvent):
        """管理员命令：立刻执行一次当前群的 LLM 审查并按规则禁言"""
        try:
            if event.get_platform_name() != "aiocqhttp":
                yield event.plain_result("❌ 此命令仅支持 QQ 平台")
                return

            message_obj = event.message_obj
            group_id = str(message_obj.group_id) if message_obj and message_obj.group_id else ""
            if not group_id:
                yield event.plain_result("❌ 此命令仅支持群聊使用")
                return

            # 刷新该群最近事件引用
            await self._touch_latest_event(group_id, event)

            total_messages = self.message_buffer.get_total_messages(group_id)
            if total_messages == 0:
                yield event.plain_result("ℹ️ 当前群缓冲区暂无可审查消息。")
                return

            yield event.plain_result(
                f"🧪 管理员强制审查已启动，当前缓冲消息 {total_messages} 条。"
            )

            await self._process_group_messages(group_id)

            yield event.plain_result("✅ 强制审查执行完成。")
        except Exception as e:
            logger.error(f"强制审查命令执行失败: {e}", exc_info=True)
            yield event.plain_result(f"❌ 强制审查失败：{e}")

    @filter.permission_type(filter.PermissionType.ADMIN)
    @filter.command("test_ban")
    async def test_ban_command(self, event: AstrMessageEvent):
        """测试禁言功能 - 禁言发送者1分钟（仅管理员可用）"""
        try:
            if event.get_platform_name() != "aiocqhttp":
                yield event.plain_result("❌ 此命令仅支持 QQ 平台")
                return

            message_obj = event.message_obj
            if not message_obj.group_id:
                yield event.plain_result("❌ 此命令仅支持群聊使用")
                return

            group_id = str(message_obj.group_id)
            user_id = str(message_obj.sender.user_id)
            user_name = event.get_sender_name()

            # 验证 Event 类型
            AiocqhttpMessageEvent = self._try_get_aiocqhttp_event_class()
            if AiocqhttpMessageEvent and not isinstance(event, AiocqhttpMessageEvent):
                yield event.plain_result("❌ Event 类型不匹配")
                return

            # 执行禁言（1分钟测试）
            client = event.bot
            test_duration = 60

            logger.info(f"执行测试禁言：群 {group_id}，用户 {user_id}（{user_name}），时长 {test_duration} 秒")

            try:
                group_id_int = int(group_id)
                user_id_int = int(user_id)
            except ValueError as ve:
                logger.error(f"类型转换失败 - group_id={group_id}, user_id={user_id}: {ve}")
                yield event.plain_result(
                    f"❌ 参数错误：无法将群ID或用户ID转换为整数\n"
                    f"group_id={group_id}, user_id={user_id}"
                )
                return

            api_timeout_seconds = float(self._get_config("api_timeout_seconds", 60))
            try:
                ret = await asyncio.wait_for(
                    client.api.call_action(
                        'set_group_ban',
                        group_id=group_id_int,
                        user_id=user_id_int,
                        duration=test_duration
                    ),
                    timeout=api_timeout_seconds,
                )
            except asyncio.TimeoutError:
                logger.error(
                    f"测试禁言 API 调用超时（>{api_timeout_seconds}s）：群 {group_id}，用户 {user_id}"
                )
                yield event.plain_result(
                    f"❌ API 调用超时（>{api_timeout_seconds}s）\n"
                    f"请检查 Bot 连接状态或平台响应。"
                )
                return
            except TypeError as te:
                logger.error(f"调用禁言 API 参数错误: {te}", exc_info=True)
                yield event.plain_result(
                    f"❌ API 参数错误：{te}\n"
                    f"请检查 Bot 配置和参数类型。"
                )
                return
            except Exception as e:
                logger.error(f"调用禁言 API 失败: {e}", exc_info=True)
                yield event.plain_result(
                    f"❌ API 调用异常：{str(e)}\n"
                    f"请检查 Bot 配置和权限。"
                )
                return

            if self.ban_executor.is_ban_api_success(ret):
                logger.info(f"测试禁言成功：用户 {user_id}")
                yield event.plain_result(
                    f"✅ 测试成功！用户 {user_name}（{user_id}）已被禁言 {test_duration} 秒。\n"
                    f"这是一次测试，用于验证禁言功能是否正常工作。"
                )
            else:
                error_msg = ret.get('message', '未知错误') if isinstance(ret, dict) else f"未知返回: {ret}"
                logger.error(f"测试禁言失败: {ret}")
                yield event.plain_result(
                    f"❌ 禁言失败：{error_msg}\n"
                    f"可能原因：Bot 不是管理员、权限不足、或 API 调用失败。"
                )

        except Exception as e:
            logger.error(f"测试禁言命令执行失败: {e}", exc_info=True)
            yield event.plain_result(f"❌ 命令执行失败：{str(e)}")

    @filter.permission_type(filter.PermissionType.ADMIN)
    @filter.command("slang_add")
    async def slang_add_command(self, event: AstrMessageEvent):
        """管理员命令：录入黑话词条

        用法：
        /slang_add 词条 [--aliases=别名1,别名2] [--category=分类] [--hint=隐喻说明] [--examples=例句1,例句2] [--severity=low|medium|high] [--global]
        """
        try:
            raw_text = (event.message_str or "").strip()
            tokens = shlex.split(raw_text)

            if len(tokens) < 2:
                yield event.plain_result(
                    "❌ 参数不足。\n"
                    "用法：/slang_add 词条 [--aliases=别名1,别名2] [--category=分类] [--hint=隐喻说明] [--examples=例句1,例句2] [--severity=low|medium|high] [--global]"
                )
                return

            canonical_term = ""
            aliases: List[str] = []
            category = "general"
            metaphor_hint = ""
            context_examples: List[str] = []
            severity_level = "medium"
            group_scope = GLOBAL_SCOPE

            for token in tokens[1:]:
                if token.startswith("--aliases="):
                    raw_aliases = token.split("=", 1)[1]
                    aliases = [item.strip() for item in raw_aliases.split(",") if item.strip()]
                elif token.startswith("--category="):
                    category_value = token.split("=", 1)[1].strip()
                    if category_value:
                        category = category_value
                elif token.startswith("--hint="):
                    hint_value = token.split("=", 1)[1].strip()
                    if hint_value:
                        metaphor_hint = hint_value
                elif token.startswith("--examples="):
                    raw_examples = token.split("=", 1)[1]
                    context_examples = [item.strip() for item in raw_examples.split(",") if item.strip()]
                elif token.startswith("--severity="):
                    severity = token.split("=", 1)[1].strip().lower()
                    if severity in {"low", "medium", "high"}:
                        severity_level = severity
                elif token == "--global":
                    group_scope = GLOBAL_SCOPE
                elif token.startswith("--"):
                    continue
                elif not canonical_term:
                    canonical_term = token.strip()

            if not canonical_term:
                yield event.plain_result("❌ 未提供有效词条。请至少提供一个黑话词条。")
                return

            if group_scope == GLOBAL_SCOPE:
                message_obj = getattr(event, "message_obj", None)
                if message_obj and getattr(message_obj, "group_id", None):
                    # 默认按当前群覆盖；显式 --global 才使用全局
                    if "--global" not in tokens[1:]:
                        group_scope = str(message_obj.group_id)

            operator_id = "system"
            message_obj = getattr(event, "message_obj", None)
            if message_obj and getattr(message_obj, "sender", None):
                operator_id = str(getattr(message_obj.sender, "user_id", "system"))

            entry = await self.slang_repository.upsert_entry(
                canonical_term=canonical_term,
                aliases=aliases,
                category=category,
                metaphor_hint=metaphor_hint,
                severity_level=severity_level,
                action_hint="review",
                group_scope=group_scope,
                source="admin_command",
                context_examples=context_examples,
                operator=operator_id,
            )

            scope_text = "全局" if entry.group_scope == GLOBAL_SCOPE else f"群 {entry.group_scope}"
            yield event.plain_result(
                "✅ 黑话词条已录入\n"
                f"- 词条: {entry.canonical_term}\n"
                f"- 别名: {', '.join(entry.aliases) if entry.aliases else '无'}\n"
                f"- 分类: {entry.category}\n"
                f"- 隐喻说明: {entry.metaphor_hint or '无'}\n"
                f"- 示例: {', '.join(entry.context_examples) if entry.context_examples else '无'}\n"
                f"- 严重等级: {entry.severity_level}\n"
                f"- 作用域: {scope_text}\n"
                f"- 版本: v{entry.version}"
            )

        except ValueError as e:
            logger.error(f"录入黑话词条失败（参数/版本）: {e}", exc_info=True)
            yield event.plain_result(f"❌ 录入失败：{e}")
        except Exception as e:
            logger.error(f"录入黑话词条失败: {e}", exc_info=True)
            yield event.plain_result(f"❌ 录入失败：{e}")

    @filter.permission_type(filter.PermissionType.ADMIN)
    @filter.command("slang_candidates")
    async def slang_candidates_command(self, event: AstrMessageEvent):
        """管理员命令：查看候选新黑话

        用法：
        /slang_candidates [--limit=10] [--all]
        """
        try:
            raw_text = (event.message_str or "").strip()
            tokens = shlex.split(raw_text)

            limit = 10
            show_all = False

            for token in tokens[1:]:
                if token.startswith("--limit="):
                    try:
                        limit = max(1, int(token.split("=", 1)[1]))
                    except ValueError:
                        limit = 10
                elif token == "--all":
                    show_all = True

            candidates = await self.slang_candidate_repository.list_top_candidates(limit=limit * 2)
            if not show_all:
                candidates = [item for item in candidates if str(item.get("status", "pending")) == "pending"]
            candidates = candidates[:limit]

            if not candidates:
                yield event.plain_result("ℹ️ 当前没有可展示的候选新黑话。")
                return

            lines = [f"🧩 候选新黑话（展示 {len(candidates)} 条）"]
            for idx, item in enumerate(candidates, start=1):
                term = str(item.get("term", "")).strip()
                category = str(item.get("category", "general")).strip() or "general"
                confidence = float(item.get("max_confidence", 0.0) or 0.0)
                count = int(item.get("count", 0) or 0)
                status = str(item.get("status", "pending") or "pending")
                hint = str(item.get("hint", "") or "").strip()
                lines.append(
                    f"{idx}. {term} | conf={confidence:.2f} | count={count} | category={category} | status={status}"
                )
                if hint:
                    lines.append(f"   hint: {hint}")

            yield event.plain_result("\n".join(lines))

        except Exception as e:
            logger.error(f"查看候选新黑话失败: {e}", exc_info=True)
            yield event.plain_result(f"❌ 查看失败：{e}")

    @filter.permission_type(filter.PermissionType.ADMIN)
    @filter.command("slang_promote")
    async def slang_promote_command(self, event: AstrMessageEvent):
        """管理员命令：将候选新黑话一键转为正式词条

        用法：
        /slang_promote 词条 [--severity=low|medium|high] [--global] [--group=群号]
        """
        try:
            raw_text = (event.message_str or "").strip()
            tokens = shlex.split(raw_text)

            if len(tokens) < 2:
                yield event.plain_result(
                    "❌ 参数不足。\n"
                    "用法：/slang_promote 词条 [--severity=low|medium|high] [--global] [--group=群号]"
                )
                return

            term = ""
            severity_level = "medium"
            group_scope = ""

            for token in tokens[1:]:
                if token.startswith("--severity="):
                    severity = token.split("=", 1)[1].strip().lower()
                    if severity in {"low", "medium", "high"}:
                        severity_level = severity
                elif token == "--global":
                    group_scope = GLOBAL_SCOPE
                elif token.startswith("--group="):
                    custom_group = token.split("=", 1)[1].strip()
                    if custom_group:
                        group_scope = custom_group
                elif token.startswith("--"):
                    continue
                elif not term:
                    term = token.strip()

            if not term:
                yield event.plain_result("❌ 未提供候选词条。")
                return

            candidate = await self.slang_candidate_repository.get_candidate(term)
            if not candidate:
                yield event.plain_result(f"❌ 未找到候选词条：{term}")
                return

            if not group_scope:
                message_obj = getattr(event, "message_obj", None)
                if message_obj and getattr(message_obj, "group_id", None):
                    group_scope = str(message_obj.group_id)
                else:
                    source_groups = [str(item) for item in candidate.get("source_groups", []) if str(item).strip()]
                    group_scope = source_groups[0] if source_groups else GLOBAL_SCOPE

            operator_id = "system"
            message_obj = getattr(event, "message_obj", None)
            if message_obj and getattr(message_obj, "sender", None):
                operator_id = str(getattr(message_obj.sender, "user_id", "system"))

            entry = await self.slang_repository.upsert_entry(
                canonical_term=str(candidate.get("term", "")).strip(),
                aliases=[],
                category=str(candidate.get("category", "general") or "general").strip(),
                metaphor_hint=str(candidate.get("hint", "") or "").strip(),
                severity_level=severity_level,
                action_hint="review",
                group_scope=str(group_scope),
                source="candidate_promote",
                context_examples=[
                    str(item).strip() for item in candidate.get("examples", []) if str(item).strip()
                ],
                operator=operator_id,
            )

            await self.slang_candidate_repository.mark_candidate_status(
                term=entry.canonical_term,
                status="promoted",
                operator=operator_id,
            )

            scope_text = "全局" if entry.group_scope == GLOBAL_SCOPE else f"群 {entry.group_scope}"
            yield event.plain_result(
                "✅ 候选词条已转正\n"
                f"- 词条: {entry.canonical_term}\n"
                f"- 分类: {entry.category}\n"
                f"- 隐喻说明: {entry.metaphor_hint or '无'}\n"
                f"- 作用域: {scope_text}\n"
                f"- 严重等级: {entry.severity_level}\n"
                f"- 版本: v{entry.version}"
            )

        except ValueError as e:
            logger.error(f"候选词条转正失败（参数/版本）: {e}", exc_info=True)
            yield event.plain_result(f"❌ 转正失败：{e}")
        except Exception as e:
            logger.error(f"候选词条转正失败: {e}", exc_info=True)
            yield event.plain_result(f"❌ 转正失败：{e}")

    @filter.event_message_type(filter.EventMessageType.GROUP_MESSAGE)
    async def on_group_message(self, event: AstrMessageEvent):
        """监听所有群消息"""
        try:
            # 检查是否为 QQ 平台
            if event.get_platform_name() != "aiocqhttp":
                return

            # 获取消息信息（添加空引用保护）
            message_obj = event.message_obj
            if not message_obj:
                logger.warning("event.message_obj 为 None，跳过该消息")
                return

            group_id = str(message_obj.group_id) if message_obj.group_id else None
            user_id = str(message_obj.sender.user_id) if message_obj.sender else None
            self_id = str(message_obj.self_id) if getattr(message_obj, "self_id", None) else None
            message_str = event.message_str
            timestamp = message_obj.timestamp
            user_name = event.get_sender_name()

            if not group_id or not user_id or not message_str.strip():
                return

            # 保存最新的 event 对象
            await self._touch_latest_event(group_id, event)

            # 不缓冲机器人自身消息
            if self_id and user_id == self_id:
                return

            # 初始化检测时间
            self.message_buffer.ensure_check_time_initialized(group_id)

            # 白名单检查
            if user_id in self._whitelist_user_ids:
                return

            # 群组过滤
            if self._group_filter_enabled and group_id not in self._enabled_group_ids:
                return

            lock = await self.message_buffer.get_or_create_lock(group_id)
            async with lock:
                # 添加消息到缓冲区（锁保护）
                self.message_buffer.append_message(group_id, user_id, {
                    "message": message_str,
                    "timestamp": timestamp,
                    "user_name": user_name
                })

                trigger_mode = self._get_config("trigger_mode", "hybrid")
                if trigger_mode == "strict_hybrid":
                    recent_limit = int(self._get_config("recent_message_limit", 50))
                    self.message_buffer.trim_recent_messages(group_id, recent_limit)

                current_count = self.message_buffer.get_total_messages(group_id)

            batch_size = self._get_config("batch_size", 10)
            trigger_mode = self._get_config("trigger_mode", "hybrid")

            logger.info(
                f"群 {group_id} 消息累积: {current_count}/{batch_size}（mode={trigger_mode}）"
            )

            # 检查是否需要触发检测
            if await self._should_trigger_check(group_id, current_count):
                await self._process_group_messages(group_id)

        except Exception as e:
            logger.error(f"处理群消息时出错: {e}", exc_info=True)

    async def _should_trigger_check(self, group_id: str, total_messages: Optional[int] = None) -> bool:
        """判断是否应该触发检测（原子操作：检查+决策在同一把锁内）"""
        trigger_mode = self._get_config("trigger_mode", "hybrid")
        check_interval = self._get_config("check_interval", 60)
        batch_size = self._get_config("batch_size", 10)

        # 原子性保证：获取计数和判断触发条件在同一把锁内
        lock = await self.message_buffer.get_or_create_lock(group_id)
        async with lock:
            if total_messages is None:
                total_messages = self.message_buffer.get_total_messages(group_id)

            last_check = self.message_buffer.get_check_time(group_id)
            current_time = time.time()
            time_elapsed = current_time - last_check

            if trigger_mode == "time_only":
                return False
            elif trigger_mode == "count_only":
                if total_messages < batch_size:
                    logger.info(f"count_only 未触发：群 {group_id} 当前 {total_messages}/{batch_size}")
                return total_messages >= batch_size
            elif trigger_mode == "hybrid":
                time_triggered = time_elapsed >= check_interval
                count_triggered = total_messages >= batch_size
                return time_triggered or count_triggered
            elif trigger_mode == "strict_hybrid":
                time_triggered = time_elapsed >= check_interval
                count_triggered = total_messages >= batch_size
                if not (time_triggered and count_triggered):
                    logger.info(
                        f"strict_hybrid 未触发：群 {group_id} time_ok={time_triggered}, count={total_messages}/{batch_size}"
                    )
                return time_triggered and count_triggered

        return False

    async def _periodic_check(self):
        """定时检测任务（用于包含时间条件的模式）"""
        while True:
            try:
                check_interval = max(1, int(self._get_config("check_interval", 60)))
                await asyncio.sleep(check_interval)

                logger.debug("执行定时检测...")
                self._refresh_runtime_config_cache()

                # 首先处理重试队列（如果有）
                if self.retry_queue:
                    logger.debug(f"开始处理{len(self.retry_queue)}条重试消息")
                    await self._process_retry_queue()

                # 遍历所有群组，筛选本轮需要检测的群
                groups_to_process: List[str] = []
                for group_id in self.message_buffer.get_group_ids_snapshot():
                    lock = await self.message_buffer.get_or_create_lock(group_id)
                    async with lock:
                        total_messages = self.message_buffer.get_total_messages(group_id)

                    # 如果有消息，则进行检测
                    if total_messages > 0:
                        trigger_mode = self._get_config("trigger_mode", "hybrid")
                        last_check = self.message_buffer.get_check_time(group_id)
                        time_elapsed = time.time() - last_check