Plug-in Expert 🔌🧠

A Modular Adapter Routing Framework for Multi-Task Learning

项目简介

Plug-in Expert 是一个模块化的多任务学习框架，融合了 LoRA、QLoRA、全参数微调等多种参数高效微调技术，并通过灵活的 硬路由（Hard Router） 与 软路由（Soft Router） 机制，实现任务感知的专家适配器组合与动态推理。该框架设计旨在为多任务设置提供高效、可扩展且可解释的适配解决方案。

该项目在 MMLU 多项选择分类任务上取得了超越传统全参微调与普通 LoRA 的表现，且支持后续扩展至多种真实任务。

🔥核心特性

支持三种适配器机制：
- LoRA
- QLoRA（低比特权重量化）
- 全参数微调
提供三种路由策略：
- 硬路由（Hard Routing）：手动指定 / BERT 分类模型预测
- 软路由（Soft Routing）：基于置信度和先验融合
- 多数投票（Majority Voting）
支持分类任务（如：IFlytek）与生成任务（MMLU）
完整支持实验可复现：支持多配置训练、路由策略消融与数据增强（COT 蒸馏）

项目结构

FlexLoRA/
├── classification/
│   └── scripts/
│       ├── train_lora.py
│       ├── train_sft.py
│       ├── infer_lora.py
│       └── infer_sft.py
├── generation/
│   └── scripts/
│       ├── train_lora_gen_multiclasses.py
│       ├── infer_lora_gen_hardrouter.py
│       ├── infer_lora_gen_softrouter.py
│       └── infer_lora_gen_majorvoting.py
├── main.py               # 统一入口：支持train/infer + 
└── ...

数据集说明

MMLU 数据集 (`/data/data_mmlu/`)

本项目使用的 MMLU (Massive Multitask Language Understanding) 数据集包含以下文件类型：

泛化数据 (Generalization Data)

mmlu_5class_balanced_1000_gen.json: 包含 2000 个泛化数据样本，涵盖 5 个学科类别（STEM、Business、Social Science、Psychology、Biomedical）的平衡分布数据，用于模型泛化能力测试。

特化数据 (Specialized Data)

mmlu_train_gen_1000_[Domain].json: 每个学科领域包含 1000 个特化训练样本，其中 [Domain] 包括：
- STEM: 科学、技术、工程、数学领域
- Business: 商业管理领域
- SocialScience: 社会科学领域
- Psychology: 心理学领域
- Biomedical: 生物医学领域

思维链增强数据 (Chain-of-Thought Enhanced Data)

mmlu_train_cot_[Domain].json: 利用 DeepSeek 模型增强的思维链数据，包含关于答案推理过程的详细说明，帮助模型理解解题思路和逻辑推理过程。

测试数据 (Test Data)

mmlu_test_gen.json: 用于模型性能评估的测试数据集，包含 2500 个测试样本。

路由数据 (Routing Data)

router_train.json: 用于训练 BERT 路由器的训练数据
router_test.json: 用于测试 BERT 路由器的测试数据

模型保存位置

训练完成后，各种模型会自动保存到以下位置：

分类任务模型

LoRA 模型: classification/model_path/
- 保存格式：epoch_{epoch}.pt (每个epoch的检查点)
- 包含：LoRA权重、分类层参数和训练配置
全参数微调模型: model_path/iflytek_model_sft/final_model/
- 保存完整的模型权重和tokenizer

生成任务模型

多类别 LoRA 模型: ../model_path/mmlu_lora/
- 每个学科领域单独保存：model_mmlu_1000_{Domain}/
- 支持的领域：STEM, Business, SocialScience, Psychology, Biomedical
COT 增强模型: ../model_path/mmlu_lora/
- 保存格式：model_mmlu_cot_{Domain}/
BERT 路由器: ./bert_subject_router/
- 用于硬路由策略的学科分类器

模型文件结构

model_path/
├── mmlu_lora/
│   ├── model_mmlu_1000_STEM/
│   ├── model_mmlu_1000_Business/
│   ├── model_mmlu_1000_SocialScience/
│   ├── model_mmlu_1000_Psychology/
│   ├── model_mmlu_1000_Biomedical/
│   └── model_mmlu_cot_*/          # COT增强版本
├── iflytek_model_sft/
│   └── final_model/
└── bert_subject_router/

安装依赖

推荐使用 Python 3.10+，建议创建虚拟环境：

conda create -n flexlora python=3.10
conda activate flexlora
pip install -r requirements.txt

依赖框架：transformers, datasets, scikit-learn, numpy, torch, accelerate 等

🔥快速开始

分类任务（Classification）

训练

python main.py --task Classification --mode train --training_method lora
# 或使用 QLoRA
python main.py --task Classification --mode train --training_method qlora

推理

python main.py --task Classification --mode infer --training_method lora

生成任务（Generation）

训练

python main.py --task Generation --mode train

**使用全参数微调（可选）**
python generation/scripts/train_lora_gen.py

训练 BERT 路由器（可选）
python generation/scripts/classifybert.py

推理

硬路由：

python main.py --task Generation --mode infer --inference_method hard_route

软路由：

python main.py --task Generation --mode infer --inference_method soft_route --soft_route_method prior&confidence_fusion

多数投票：

python main.py --task Generation --mode infer --inference_method soft_route --soft_route_method major_voting

实验结果（部分）

方法	Overall	STEM	Business	SocialScience	Psychology	Biomedical
Baseline	0.572	0.420	0.600	0.590	0.680	0.570
+LoRA	0.588	0.460	0.630	0.630	0.670	0.550
Hard Router	0.626	0.510	0.650	0.700	0.700	0.570
Soft Router	0.620	0.520	0.640	0.670	0.700	0.570
Major Voting	0.612	0.480	0.650	0.670	0.690	0.570

Name		Name	Last commit message	Last commit date
Latest commit History 32 Commits
adapters		adapters
classification		classification
data		data
engine		engine
flexlora.egg-info		flexlora.egg-info
generation/scripts		generation/scripts
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
infer_classification.sh		infer_classification.sh
infer_generation.sh		infer_generation.sh
lora_model_comparison.png		lora_model_comparison.png
lora_module_comparison.png		lora_module_comparison.png
lora_weight_distributions.png		lora_weight_distributions.png
main.py		main.py
requirements.txt		requirements.txt
setup.py		setup.py
train_classification.sh		train_classification.sh
train_generation.sh		train_generation.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Plug-in Expert 🔌🧠

项目简介

🔥核心特性

项目结构

数据集说明

MMLU 数据集 (`/data/data_mmlu/`)

泛化数据 (Generalization Data)

特化数据 (Specialized Data)

思维链增强数据 (Chain-of-Thought Enhanced Data)

测试数据 (Test Data)

路由数据 (Routing Data)

模型保存位置

分类任务模型

生成任务模型

模型文件结构

安装依赖

🔥快速开始

分类任务（Classification）

训练

推理

生成任务（Generation）

训练

推理

实验结果（部分）

About

Uh oh!

Releases

Packages

Contributors 4

Uh oh!

Languages

Heeqw/Plug-in-Expert

Folders and files

Latest commit

History

Repository files navigation

Plug-in Expert 🔌🧠

项目简介

🔥核心特性

项目结构

数据集说明

MMLU 数据集 (/data/data_mmlu/)

泛化数据 (Generalization Data)

特化数据 (Specialized Data)

思维链增强数据 (Chain-of-Thought Enhanced Data)

测试数据 (Test Data)

路由数据 (Routing Data)

模型保存位置

分类任务模型

生成任务模型

模型文件结构

安装依赖

🔥快速开始

分类任务（Classification）

训练

推理

生成任务（Generation）

训练

推理

实验结果（部分）

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Uh oh!

Languages

MMLU 数据集 (`/data/data_mmlu/`)

Packages