MaxKB Version
v2.2.1
Problem Description
我们的MaxKB和模型都是纯内网部署,不通外网的环境。
MaxKB 配置本地通过VLLM部署的bge-m3向量模型,保存异常,异常截图如下:

去掉地址的 后缀 也是一样的报错:

根据异常提示信息:Max retries exceeded with url:/encoding/cl100k_base.tiktoken
这个错误表明程序在尝试下载 tokenizer 文件时遇到了网络连接问题。cl100k_base.tiktoken 是 OpenAI tokenizer 的配置文件,通常用于文本编码。
推测原因:
因为加载本地的bge模型的时候,依赖了远端的tokenizer分词器,需要请求外部进行加载,因为内网环境无法请求外网地址导致加载异常。
The expected correct result
如果是因为加载本地的bge模型的时候,依赖了远端的tokenizer分词器,希望将依赖内置到安装包中,不要依赖于外部,或者支持配置使用内置依赖进行加载。
Related log output
Additional Information
No response