张维为教授总能一针见血地指出社会的问题,学养深厚,深受大家喜爱。我整理了张教授的诸多语录,可以使用关键词或者BGE-M3模型检索,帮助大家日常学习。
- 2025-3-5: 重新从265期视频中,根据whisper定位有字幕帧,然后提取该帧并用GOT-OCR2_0 进行OCR识别,并进行字幕去重、去掉没有张教授出现的图片,一共得到11.7万张无重复的、包含张维为教授人脸的图片。称为“张教授表情包库2.0”。 并且普通版本不再需要下载pytorch
下载地址:
1.0版 百度网盘:https://pan.baidu.com/s/1oR9d-Yx_j7U013C6eaKCsg?pwd=wkgj (1.0版本不再建议下载,请使用2.0版本)
2.0版 百度网盘:https://pan.baidu.com/s/126L5xCbZHJnqZh3M_MW1QA?pwd=496a
(onlyvv.zip是onlyvv的压缩包,下载之后解压)
把网盘中的内容按以下方式组织
├── README.md
├── search.py
├── requirements.txt
├── bge-m3
├── cached_file.npy
├── onlyvv-result-no-repeat.json
├── demo.png
└── onlyvv
├── 001
└──frame_0002.jpg
├── 002
└──frame_0010.jpg
├── 002
├── 003
conda create -n auto-vv-machine python=3.10
conda activate auto-vv-machine
pip install -r requirements.txt
在普通模式基础上安装:
(cuda版本和cpu版本请根据硬件选择其中一个)
cuda版本:
pip install torch==2.3.0 --index-url https://download.pytorch.org/whl/cu118
cpu版本:
pip install torch==2.3.0
pip install -U FlagEmbedding
git clone https://huggingface.co/BAAI/bge-m3 // 这一步不进行会自动联网下载,注意你的网络情况。如果网络情况不太好,可以从百度网盘中下载模型文件放入目录下。
注意:AI模式可以不安装,仅使用关键词搜索。如果启用AI模式+CUDA,建议空闲显存至少为6G;如果启用AI模式+CPU,建议空闲内存至少为8G
python search.py
可以在最上方设置设备为cpu或者cuda:0,选择之后点一下Set device按钮。
每次运行后,第一次用AI检索会有点慢,是因为模型还在导入。
