|
35 | 35 | - **硬件要求极低**:无需GPU,只需最基础的单核CPU搭配最低的运存即可完成录制,弹幕渲染,上传等等全部过程,无最低配置要求,10年前的电脑或服务器依然可以使用! |
36 | 36 | - **( :tada: NEW)自动渲染字幕**(如需使用本功能,则需保证有 Nvidia 显卡):采用 OpenAI 的开源模型 [`whisper`](https://github.com/openai/whisper),自动识别视频内语音并转换为字幕渲染至视频中。 |
37 | 37 | - **( :tada: NEW)自动切片上传**:根据弹幕密度计算寻找高能片段并切片,该自动切片工具库已开源 [auto-slice-video](https://github.com/timerring/auto-slice-video) |
38 | | - ,结合多模态视频理解大模型 [`GLM-4V-PLUS`](https://bigmodel.cn/dev/api/normal-model/glm-4) 自动生成有意思的切片标题及内容,并且自动上传。 |
| 38 | + ,结合多模态视频理解大模型 [`GLM-4V-PLUS`](https://bigmodel.cn/dev/api/normal-model/glm-4) 或者 [`Gemini-2.0-flash`](https://deepmind.google/technologies/gemini/flash/) 自动生成有意思的切片标题及内容,并且自动上传。 |
39 | 39 | - **( :tada: NEW)持久化登录/下载/上传视频(支持多p投稿)**:[bilitool](https://github.com/timerring/bilitool)已经开源,实现持久化登录,下载视频及弹幕(含多p)/上传视频(可分p投稿),查询投稿状态,查询详细信息等功能,一键pip安装,可以使用命令行 cli 操作,也可以作为api调用。 |
40 | 40 | - **( :tada: NEW)自动多平台循环直播推流**:该工具已经开源 [looplive](https://github.com/timerring/looplive) 是一个 7 x 24 小时全自动**循环多平台同时推流**直播工具。 |
41 | 41 |
|
@@ -137,21 +137,36 @@ pip install -r requirements.txt |
137 | 137 | ./setPath.sh && source ~/.bashrc |
138 | 138 | ``` |
139 | 139 |
|
140 | | -#### 3. 配置 whisper 模型及 GLM-4V-PLUS 模型 |
| 140 | +#### 3. 配置 whisper 模型及 MLLM 模型 |
141 | 141 |
|
142 | | -##### 3.1 whisper 模型 |
| 142 | +##### 3.1 whisper 模型(字幕识别) |
143 | 143 | 项目默认采用 [`small`](https://openaipublic.azureedge.net/main/whisper/models/9ecf779972d90ba49c06d968637d720dd632c55bbf19d441fb42bf17a411e794/small.pt) 模型,请点击下载所需文件,并放置在 `src/subtitle/models` 文件夹中。 |
144 | 144 |
|
145 | 145 | > [!TIP] |
146 | 146 | > 使用该参数模型至少需要保证有显存大于 2.7GB 的 GPU,否则请使用其他参数量的模型。 |
147 | 147 | > + 更多模型请参考 [whisper 参数模型](https://timerring.github.io/bilive/models.html) 部分。 |
148 | 148 | > + 更换模型方法请参考 [更换模型方法](https://timerring.github.io/bilive/models.html#更换模型方法) 部分。 |
149 | 149 |
|
150 | | -##### 3.2 GLM-4V-PLUS 模型 |
| 150 | +##### 3.2 MLLM 模型 |
151 | 151 |
|
152 | | -> 此功能默认关闭,如果需要打开请将 `src/config.py` 文件中的 `AUTO_SLICE` 参数设置为 `True` |
| 152 | +MLLM 模型主要用于自动切片后的切片标题生成,此功能默认关闭,如果需要打开请将 `src/config.py` 文件中的 `AUTO_SLICE` 参数设置为 `True`。其他配置分别有: |
| 153 | +- `SLICE_DURATION` 以秒为单位设置切片时长(不建议超过 60 秒)。 |
| 154 | +- `SLICE_NUM` 设置切片数量。 |
| 155 | +- `SLICE_OVERLAP` 设置切片重叠时长。切片采用滑动窗口法处理,细节内容请见 [auto-slice-video](https://github.com/timerring/auto-slice-video) |
| 156 | +- `SLICE_STEP` 设置切片步长。 |
| 157 | +- `MIN_VIDEO_SIZE` 设置切片最小视频大小。防止对一些连线或者网络波动原因造成的短片段再切片。 |
153 | 158 |
|
154 | | -在配置文件 `src/config.py` 中,`SLICE_DURATION` 以秒为单位设置切片时长(不建议超过 1 分钟),在项目的自动切片功能需要使用到智谱的 [`GLM-4V-PLUS`](https://bigmodel.cn/dev/api/normal-model/glm-4) 模型,请自行[注册账号](https://www.bigmodel.cn/invite?icode=shBtZUfNE6FfdMH1R6NybGczbXFgPRGIalpycrEwJ28%3D)并申请 API Key,填写到 `src/config.py` 文件中对应的 `Your_API_KEY` 中。 |
| 159 | +##### 3.2.1 GLM-4V-PLUS 模型 |
| 160 | + |
| 161 | +> 如需使用 GLM-4V-PLUS 模型,请将 `src/config.py` 文件中的 `MLLM_MODEL` 参数设置为 `zhipu` |
| 162 | +
|
| 163 | +在项目的自动切片功能需要使用到智谱的 [`GLM-4V-PLUS`](https://bigmodel.cn/dev/api/normal-model/glm-4) 模型,请自行[注册账号](https://www.bigmodel.cn/invite?icode=shBtZUfNE6FfdMH1R6NybGczbXFgPRGIalpycrEwJ28%3D)并申请 API Key,填写到 `src/config.py` 文件中对应的 `ZHIPU_API_KEY` 中。 |
| 164 | + |
| 165 | +##### 3.2.2 Gemini 模型 |
| 166 | + |
| 167 | +> 如需使用 Gemini-2.0-flash 模型,请将 `src/config.py` 文件中的 `MLLM_MODEL` 参数设置为 `gemini` |
| 168 | +
|
| 169 | +在项目的自动切片功能需要使用到 Gemini-2.0-flash 模型,请自行[注册账号](https://aistudio.google.com/app/apikey)并申请 API Key,填写到 `src/config.py` 文件中对应的 `GEMINI_API_KEY` 中。 |
155 | 170 |
|
156 | 171 | #### 4. bilitool 登录 |
157 | 172 |
|
|
0 commit comments