Skip to content

[Bug] MaxKB configures the bge-m3 vector model deployed locally through VLLM, saving exception #4308

@ZhaoQian1222

Description

@ZhaoQian1222

MaxKB Version

v2.2.1

Problem Description

我们的MaxKB和模型都是纯内网部署,不通外网的环境。
MaxKB 配置本地通过VLLM部署的bge-m3向量模型,保存异常,异常截图如下:

Image

去掉地址的 后缀 也是一样的报错:

Image

根据异常提示信息:Max retries exceeded with url:/encoding/cl100k_base.tiktoken
这个错误表明程序在尝试下载 tokenizer 文件时遇到了网络连接问题。cl100k_base.tiktoken 是 OpenAI tokenizer 的配置文件,通常用于文本编码。

推测原因:
因为加载本地的bge模型的时候,依赖了远端的tokenizer分词器,需要请求外部进行加载,因为内网环境无法请求外网地址导致加载异常。

The expected correct result

如果是因为加载本地的bge模型的时候,依赖了远端的tokenizer分词器,希望将依赖内置到安装包中,不要依赖于外部,或者支持配置使用内置依赖进行加载。

Related log output

Additional Information

No response

Metadata

Metadata

Assignees

Labels

No labels
No labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions