MaxKB Version
v2.0
Please describe your needs or suggestions for improvements
希望增加用户流量控制,通过tokens形式,限定用户指定时间内最多使用的tokens数量,目前只有限制客户端调用次数。
例如,用户通过接口或频繁与助手交互时,需要限制其使用的模型tokens,避免模型资源被大量消耗。
Please describe the solution you suggest
No response
Additional Information
No response