Skip to content

[A-16] LoRA v2 파인튜닝 (문서 특화) #16

@sjy361872

Description

@sjy361872

설명

베이스 모델에 LoRA로 문서 분석 특화 파인튜닝을 수행합니다.

선행 조건

  • [B-1] 모델 벤치마크 완료 후 동일 모델 사용

TODO

  • PEFT LoRA 설정
  • QLoRA 4-bit 양자화 설정
  • 학습 실행 (RunPod A100)
  • 하이퍼파라미터 실험
  • 팀원 B와 교차 검증
  • 베이스라인 대비 개선율 측정

담당 파일

  • ai/finetuning/train_v2_document.py
  • ai/finetuning/configs/v2_document.yaml

Metadata

Metadata

Assignees

Labels

4단계:파인튜닝데이터 수집 + 파인튜닝priority:높음블로커 - 다른 작업에 영향지용:PM신지용 (PM + Intent + 오케스트레이션)

Type

No type

Projects

No projects

Relationships

None yet

Development

No branches or pull requests

Issue actions