File tree Expand file tree Collapse file tree 1 file changed +29
-0
lines changed Expand file tree Collapse file tree 1 file changed +29
-0
lines changed Original file line number Diff line number Diff line change 92
92
贝叶斯算法本质是个概率算法,如果它没有见过类似的广告,那么它就没法判断是否垃圾广告 :(
93
93
94
94
稍安勿躁,你需要做只是使用 =/markspam= 删除消息并封禁用户,就可以帮助训练这个bot, 所有使用这个 bot 的用户都会因此受益
95
+ *** wocao, 你这个机器人怎么把我正常的聊天消息也误删了?
96
+ 我知道误删消息相当令人不爽,所以我已经竭力优化机器人,提高置信度(是广告的概率超过95%才会被判定为广告),
97
+ 但是因为即时通信消息「[[https://ramsayleung.github.io/zh/post/2025/%E5%9F%BA%E4%BA%8E%E8%B4%9D%E5%8F%B6%E6%96%AF%E7%AE%97%E6%B3%95%E7%9A%84telegram%E5%B9%BF%E5%91%8A%E6%8B%A6%E6%88%AA%E6%9C%BA%E5%99%A8%E4%BA%BA%E4%BA%8C/#%E9%82%AE%E4%BB%B6%E4%B8%8E%E5%8D%B3%E6%97%B6%E6%B6%88%E6%81%AF%E7%9A%84%E5%B7%AE%E5%BC%82][短文本+无上下文]]」的特性,误删仍然是无法完全根除的。
98
+
99
+ 比如聊天消息是 =境外CDN= ,管理员认为是正常群聊,但被误删。实际这个消息和广告非常相似,比如有些广告是:
100
+
101
+ #+begin_quote
102
+ 🔥 国内 - 海外 服务器 免备案 大带宽 欢迎业务 🌍 CDN加速网站 高防 过移动屏蔽 🔴 直播 推拉流 稳定 大带宽 不限制流量 🛠️ 搭建 专业定制开发app 🔥🔥 📱 销售:@cdncloud001 📢 频道: @xxxx
103
+ #+end_quote
104
+
105
+ 正常聊天消息 =京东淘宝 tg = 被误删,这个和广告也相当类似:
106
+
107
+ #+begin_quote
108
+ 有淘宝京东闲鱼抖音购物软件的兄弟来找我干活 一单一结280秒结 @xxxx21
109
+ #+end_quote
110
+
111
+ #+begin_quote
112
+ 一手出 微信 QQ 支付宝 抖音 京东 淘宝 WS 火种 手机卡 电销卡 流量卡 需要联系唯一客服飞机: @xxxx01 双向 @xxxx_bot
113
+ #+end_quote
114
+
115
+ 所以提供了 =/listspam= 命令给管理员,管理员可以查看被删除的消息,如果发现有被误判的,可以手工标记为正常:
116
+
117
+ [[./doc/img/listspam.jpg]]
118
+ *** 如何看到删除的消息?
119
+ 有些消息被删除了,但是不知道有没有误删,有日志吗?
120
+
121
+ 可以通过 =/listspam= 看到被删除的消息,如果看到有消息被误标记为广告,也可以将其标记为正常:
122
+
123
+ [[./doc/img/listspam.jpg]]
You can’t perform that action at this time.
0 commit comments